阿里云文档 2025-06-05

使用Hadoop命令操作OSS/OSS-HDFS

在使用阿里云EMR Serverless Spark的Notebook时,您可以通过Hadoop命令直接访问OSS或OSS-HDFS数据源。本文将详细介绍如何通过Hadoop命令操作OSS/OSS-HDFS。

阿里云文档 2024-08-12

通过Hadoop Shell以命令行的方式访问OSS-HDFS服务

如果您希望通过命令行的方式在开通OSS-HDFS服务的Bucket中执行上传、下载、删除等相关操作,您可以使用Hadoop Shell的方式。

阿里云文档 2023-09-03

如何管理OSS/OSS-HDFSHadoop回收站_EMR on ECS_开源大数据平台 E-MapReduce(EMR)

Hadoop回收站是Hadoop文件系统的重要功能,可以恢复误删除的文件和目录。本文为您介绍Hadoop回收站的使用方法。

阿里云文档 2023-09-03

如何管理HDFSHadoop回收站_EMR on ECS_开源大数据平台 E-MapReduce(EMR)

Hadoop回收站是Hadoop文件系统的重要功能,可以恢复误删除的文件和目录。本文为您介绍Hadoop回收站的使用方法。

阿里云文档 2023-02-23

Dataphin在Hadoop环境上传的资源JAR包,存放的HDFS路径是什么

概述本文主要介绍Dataphin在Hadoop环境上传的资源JAR包,存放的HDFS路径是什么。详细信息Dataphin在Hadoop环境上传的资源JAR包,存放的HDFS路径是什么?介绍如下:所有用户上传的资源JAR包,以及安全包的资源,都是默认放在/tmp/dataphin/目录下。该目录下会区...

文章 2022-02-16 来自:开发者社区

Hadoop HDFS概念学习系列之初步掌握HDFS的架构及原理1(一)

HDFS 是做什么的?         HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上。它所具有的高容错、高可靠性、高可扩展性、高获得性、高吞吐率等特...

Hadoop HDFS概念学习系列之初步掌握HDFS的架构及原理1(一)
文章 2022-02-16 来自:开发者社区

Hadoop HDFS概念学习系列之初步掌握HDFS的架构及原理2(二)

HDFS 如何读取文件?   HDFS的文件读取原理,主要包括以下几个步骤: 1、首先调用FileSystem对象的open方法,其实获取的是一个DistributedFileSystem的实例。 2、DistributedFileSystem通过RPC(远程过程调用)获得文件的第一批block的locations,同一block按照重复数会返回多个locations,这些locatio...

Hadoop HDFS概念学习系列之初步掌握HDFS的架构及原理2(二)
文章 2022-02-16 来自:开发者社区

Hadoop HDFS概念学习系列之初步掌握HDFS的架构及原理3(三)

HDFS 如何写入文件?   HDFS的文件写入原理,主要包括以下几个步骤:   1.客户端通过调用DistributedFileSystem的create方法,创建一个新的文件。   2.DistributedFileSystem通过RPC(远程过程调用)调用NameNode,去创建一个没有blocks关联的新文件。创建前,NameNode 会做各种校验,比如文件是否存在,客户端有无权...

Hadoop HDFS概念学习系列之初步掌握HDFS的架构及原理3(三)
文章 2022-02-16 来自:开发者社区

Hadoop HDFS概念学习系列之初步掌握HDFS的架构及原理4(四)

HDFS 副本存放策略         namenode 如何选择在哪个 datanode 存储副本(replication)?这里需要对可靠性、写入带宽和读取带宽进行权衡。 Hadoop 对 datanode 存储副本有自己的副本策略,在其发展过程中一共有两个版本的副本策略,分别如下所示。 Hadoop 0...

Hadoop HDFS概念学习系列之初步掌握HDFS的架构及原理4(四)
文章 2022-02-16 来自:开发者社区

Hadoop HDFS概念学习系列之HDFS升级和回滚机制(十二)

HDFS升级和回滚机制   作为一个大型的分布式系统,Hadoop内部实现了一套升级机制,当在一个集群上升级Hadoop时,像其他的软件升级一样,可能会有新的bug或一些会影响现有应用的非兼容性变更出现。在任何有实际意义的HDFS系统中,丢失数据是不允许的,更不用说重新搭建启动HDFS了。当然,升级可能成功,也可能失败。如果失败了,那就用rollback进行回滚;如果过了一段时间,系统运行正常,....

Hadoop HDFS概念学习系列之HDFS升级和回滚机制(十二)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注