阿里云文档 2025-03-21

使用Hadoop命令操作OSS/OSS-HDFS

在使用阿里云EMR Serverless Spark的Notebook时,您可以通过Hadoop命令直接访问OSS或OSS-HDFS数据源。本文将详细介绍如何通过Hadoop命令操作OSS/OSS-HDFS。

阿里云文档 2025-03-14

2025-03-03版本说明

本文为您介绍2025年03月03日发布的EMR Serverless Spark的功能变更。

阿里云文档 2025-03-11

阿里云StarRocks业务使用最佳实践

本文旨在为您介绍StarRocks的基础使用方法和常见操作,适用于首次接触StarRocks的用户。

阿里云文档 2025-03-10

通过Java代码连接启用了Kerberos认证的EMR Hive

在企业级大数据平台中,Kerberos认证是保障Hadoop、Hive、HBase等组件安全性的关键机制。当本地Java客户端需要连接到启用了Kerberos认证的EMR集群时,必须正确配置Kerberos,并利用Hive JDBC驱动进行连接。本文将介绍在macOS/Linux环境中,通过Java代码连接到启用了Kerberos认证的EMR Hive服务的方法。

阿里云文档 2025-03-10

容灾管理(Beta)

容灾管理功能主要为存算分离的实例提供多可用区(AZ)部署能力,确保在某个可用区出现不可用情况时仍能保障数据的正常访问。多可用区部署时,数据底层采用同城冗余存储,以提供更高的可靠性。本文将主要介绍容灾管理的基本使用方法。

文章 2024-06-12 来自:开发者社区

【大数据】MapReduce JAVA API编程实践及适用场景介绍

1.前言 本文是作者大数据系列专栏的其中一篇,前文我们依次聊了大数据的概论、分布式文件系统、分布式数据库、以及计算引擎mapreduce核心概念以及工作原理。 书接上文,本文将会继续聊一下mapreduce的编程实践以及mapreduce的适用场景。基于的Hadoop版本依然是前文的hadoop3.1.3。 2.mapreduce编程示例 本文依然以最经典的单词分...

【大数据】MapReduce JAVA API编程实践及适用场景介绍
文章 2024-05-14 来自:开发者社区

大数据实战——基于Hadoop的Mapreduce编程实践案例的设计与实现

一、数据排序案例的设计与实现 1.1设计思路 图1:MaxCompute MapReduce各个阶段思路设计 设计思路分析分为六个模块:input输入数据、splitting拆分、Mapping映射、Shuf...

大数据实战——基于Hadoop的Mapreduce编程实践案例的设计与实现
文章 2022-02-16 来自:开发者社区

《Hadoop与大数据挖掘》一2.4.4 MapReduce组件分析与编程实践

本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.4.4节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.4.4 MapReduce组件分析与编程实践 MapReduce整个流程包括以下步骤:输入格式(InputFormat)、Mapper、Combiner、Partitioner、Reducer、输....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐