阿里云文档 2024-03-27

DataWorks OpenAPI最佳实践

DataWorks提供了丰富的OpenAPI,您可以根据需要使用DataWorks的OpenAPI等开放能力实现各种业务场景,本文为您介绍DataWorks OpenAPI的最佳实践。

文章 2023-11-13 来自:开发者社区

:大数据行业部署实战3:基于Hadoop的Web版的云盘

一、实验目的熟练采用JAVA API访问 HDFS。二、实验原理HDFS是hadoop平台的核心组成之一。熟悉使用hadoop平台需要熟练访问HDFS。HDFS的访问方式有多种。可通过web访问,也可通过shell方式或者API方式访问。基本操作有对文件的读、写、追加、删除等。新建文件夹、删除文件夹等。还可显示文件及文件夹的属性。HDFS主要用到了FileSystem类,相关的接口可以在这里查到....

:大数据行业部署实战3:基于Hadoop的Web版的云盘
文章 2023-11-13 来自:开发者社区

大数据行业部署实战2:环境大数据统计

一、实验目的学会分析环境数据文件;学会编写解析环境数据文件并进行统计的代码;学会进行递归MapReduce。二、实验要求在服务器上运行从北京2016年1月到6月这半年间的历史天气和空气质量数据文件中分析出的环境统计结果,包含月平均气温、空气质量分布情况等。三、实验原理近年来,由于雾霾问题的持续发酵,越来越多的人开始关注城市相关的环境数据,包括空气质量数据、天气数据等等。如果每小时记录一次城市的天....

大数据行业部署实战2:环境大数据统计
文章 2023-11-13 来自:开发者社区

大数据行业部署实战1:Hadoop伪分布式部署

一、Hadoop 介绍Apache Hadoop 软件库是一个框架,允许在集群服务器上使用简单的编程模型对大数据集进行分布式处理。Hadoop 被设计成能够从单台服务器扩展到数以千计的服务器,每台服务器都有本地的计算和存储资源。Hadoop 的高可用性并不依赖硬件,其代码库自身就能在应用层侦测并处理硬件故障,因此能基于服务器集群提供高可用性的服务。1. Hadoop 生态系统主要包含以下几部分:....

大数据行业部署实战1:Hadoop伪分布式部署
阿里云文档 2023-09-03

JindoFS实战的详细文档和演示视频_EMR on ECS_开源大数据平台 E-MapReduce(EMR)

通过JindoFS,您可以完成数据迁移、OSS访问加速、缓存加速、AI训练加速和JindoTable计算加速。本文为您介绍JindoFS实战的详细文档和演示视频。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute实战相关内容

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注