阿里云文档 2025-09-16

无需解冻直接实时读取OSS-HDFS服务归档文件

归档直读是指直接访问OSS-HDFS服务中归档存储类型的文件,而无需先对其解冻。归档直读适用于实时读取极少需要访问的数据场景。

阿里云文档 2025-07-10

使用Check节点检查数据源或实时同步任务是否可用

DataWorks的Check节点可用于检查目标对象(MaxCompute分区表、FTP文件、OSS文件、HDFS文件、OSS_HDFS文件以及实时同步任务)是否可用,当Check节点满足检查策略后会返回运行成功状态。如果某任务的运行依赖目标对象,您可使用Check节点检查目标对象,并设置该任务为Check节点的下游任务,当Check节点满足检查策略后,便会运行成功并触发下游任务执行。本文为您介绍...

阿里云文档 2024-08-06

访问权限的概念、使用方式及其相关注意事项

文件存储 HDFS 版为目录和文件提供了一种访问权限,该访问权限类似于POSIX文件系统的权限模型。本文简要介绍访问权限的概念、使用方式及其相关注意事项。

阿里云文档 2024-05-13

写入HDFS出现无法close文件的解决方案

本文介绍写入HDFS出现无法close文件的异常的解决方案。

阿里云文档 2023-09-13

如何进行文件内容校验_EMR on ECS_开源大数据平台 E-MapReduce(EMR)

通过JindoDistCp从HDFS迁移到OSS-HDFS的文件,可以进行文件内容检验。本文为您介绍文件内容校验的操作步骤。

文章 2022-02-15 来自:开发者社区

找回HDFS corrupted文件残留数据

因为某种历史原因集群出现了一批corrupted文件。读取这些文件会报“BlockMissingException”异常,例如: 6/11/08 19:04:20 WARN hdfs.DFSClient: DFS Read org.apache.hadoop.hdfs.BlockMissingException: Could not obtain block: BP-221196964-172.....

文章 2022-02-15 来自:开发者社区

HDFS读文件过程分析:读取文件的Block数据

我们可以从java.io.InputStream类中看到,抽象出一个read方法,用来读取已经打开的InputStream实例中的字节,每次调用read方法,会读取一个字节数据,该方法抽象定义,如下所示: public abstract int read() throws IOException; Hadoop的DFSClient.DFSInputStream类实现了该抽象逻辑,如果我们清楚了如....

问答 2022-02-15 来自:开发者社区

我用hdfs将冷数据存储起来后 后续想要查询文件中某些数据 应该怎么处理呢?#云原生后端

我用hdfs将冷数据存储起来后 后续想要查询文件中某些数据 应该怎么处理呢?#云原生后端 来源:云原生后端社区https://www.yuque.com/server_mind/answer

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云存储

阿里云存储基于飞天盘古2.0分布式存储系统,产品多种多样,充分满足用户数据存储和迁移上云需求。

+关注