阿里云文档 2026-03-05

元数据共享模型表结构定义与版本变动-智能数据建设与治理 Dataphin-阿里云

本文为您介绍Hadoop计算引擎下提供的元数据共享模型详情。概述为了支持更灵活的数据分析及二次开发,需要使用Dataphin的元数据信息。Dataphin以元数据共享模型的方式将系统元数据对外开放。元数据共享模型的使用方式请参见元数据仓库共享模型。元数据仓库共享模型使用说明共享模型表每个分区存储全量...

阿里云文档 2026-02-10

创建Hadoop计算源并绑定项目以支持离线计算-智能数据建设与治理Dataphin-阿里云

Hadoop计算源用于绑定Dataphin项目空间与Hadoop项目,为Dataphin项目提供处理离线计算任务的计算源。如果Dataphin系统的计算引擎设置为Hadoop,则只有项目空间添加了Hadoop计算源,才支持规范建模、即席查询、Hive任务、通用脚本等功能。本文为您介绍如何新建Hadoop计算源。

阿里云文档 2026-01-13

创建HADOOP_MR离线计算任务-智能数据建设与治理 Dataphin-阿里云

本文为您介绍如何基于Dataphin构建MapReduce on Yarn类型的离线计算任务。

阿里云文档 2026-01-04

配置Hadoop计算引擎完成元仓初始化-Dataphin-阿里云

Dataphin元数据仓库(简称:元仓),是统一管理Dataphin内部业务元数据和相应计算引擎元数据的数据仓库,存在于Dataphin元仓租户中(OPS租户)的一个Dataphin项目空间中,由一系列的周期性数据集成节点、SQL脚本节点、Shell节点组成。元仓初始化即配置Dataphin系统的计算引擎类型并初始化元数据的过程。本文将为您介绍如何使用Hadoop作为元仓计算引擎进行元仓初始化。

阿里云文档 2025-11-18

查看物理视图资产详情-智能数据建设与治理Dataphin-阿里云

本文为您介绍如何查看计算引擎为MaxCompute、Hadoop、Lindorm(计算引擎)、GaussDB(DWS)、Databricks、Amazon EMR时的物理视图和字段资产详情。

文章 2024-05-26 来自:开发者社区

Hadoop 集群小文件归档 HAR、小文件优化 Uber 模式

@[toc] 小文件归档 HAR 小文件归档是指将大量小文件合并成较大的文件,从而减少存储开销、元数据管理的开销以及处理时的任务调度开销。 这里我们通过 Hadoop Archive (HAR) 来进行实现,它是一种归档格式,可以将多个小文件和目录归档成单个 HAR 文件。 在进行下面的操作前,请先启动集群。 对小文件进行归档 当前,在 /input 目录下存储了 3 个小...

Hadoop 集群小文件归档 HAR、小文件优化 Uber 模式
文章 2022-02-17 来自:开发者社区

Hadoop2.6.0运行mapreduce之Uber模式验证

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/beliefer/article/details/51160494 前言 在有些情况下,运行于Hadoop集群上的一些mapreduce作业本身的数据量并不是很大,如果此时的任务分片很多,那么为每个map任务或...

Hadoop2.6.0运行mapreduce之Uber模式验证

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注