阿里云文档 2026-01-13

创建HADOOP_MR离线计算任务-智能数据建设与治理 Dataphin-阿里云

本文为您介绍如何基于Dataphin构建MapReduce on Yarn类型的离线计算任务。

阿里云文档 2026-01-13

元数据仓库共享模型(Hadoop/StarRocks等计算引擎)-智能数据建设与治理 Dataphin-阿里云

本文为您介绍Hadoop计算引擎下提供的元数据共享模型详情。概述为了支持更灵活的数据分析及二次开发,需要使用Dataphin的元数据信息。Dataphin以元数据共享模型的方式将系统元数据对外开放。元数据共享模型的使用方式请参见元数据仓库共享模型。元数据仓库共享模型使用说明共享模型表每个分区存储全量...

阿里云文档 2026-01-06

配置Hadoop计算源以绑定项目空间-智能数据建设与治理 Dataphin-阿里云

Hadoop计算源用于绑定Dataphin项目空间与Hadoop项目,为Dataphin项目提供处理离线计算任务的计算源。如果Dataphin系统的计算引擎设置为Hadoop,则只有项目空间添加了Hadoop计算源,才支持规范建模、即席查询、Hive任务、通用脚本等功能。本文为您介绍如何新建Hadoop计算源。

阿里云文档 2026-01-04

配置Hadoop计算引擎完成元仓初始化-Dataphin-阿里云

Dataphin元数据仓库(简称:元仓),是统一管理Dataphin内部业务元数据和相应计算引擎元数据的数据仓库,存在于Dataphin元仓租户中(OPS租户)的一个Dataphin项目空间中,由一系列的周期性数据集成节点、SQL脚本节点、Shell节点组成。元仓初始化即配置Dataphin系统的计算引擎类型并初始化元数据的过程。本文将为您介绍如何使用Hadoop作为元仓计算引擎进行元仓初始化。

阿里云文档 2025-11-18

查看物理视图资产详情-智能数据建设与治理Dataphin-阿里云

本文为您介绍如何查看计算引擎为MaxCompute、Hadoop、Lindorm(计算引擎)、GaussDB(DWS)、Databricks、Amazon EMR时的物理视图和字段资产详情。

问答 2022-04-15 来自:开发者社区

【案例】从hadoop框架与MapReduce模式中谈海量数据处理

首先申明,不是我原创,但是我看到比较不错的一片讲大数据分析处理的文章。谈到的阿里使用的云梯1,确实是使用的如下文的机制。但云梯1在阿里已经下线,目前使用的云梯2是用的ODPS的机制。技术架构和思路都可以参考和讨论。呵呵,特别是还有淘宝的数据魔方产品作为案例讲解,不错不错,就转了 第一部分、mapreduce模式与hadoop框架深入浅...

文章 2022-02-17 来自:开发者社区

YARN(hadoop2)框架的一些软件设计模式

概述 我们都知道,yarn版本的hadoop无论是从架构上面还是软件设计的层面上面都比原始的hadoop版本有较大的改进。在架构方面,我们认为yarn模式是新一代的框架,这个在官方等丛多的资料中说明得很详细了。在软件设计方面,我认为主要有以下的一些大的方面的改进:服务生命周期管理模式、事件驱动模式、状态驱动模式。这几个模式都写在hadoop-yarn-common中,接下来,我将详细说明这些模式....

YARN(hadoop2)框架的一些软件设计模式
文章 2022-02-16 来自:开发者社区

从Hadoop框架与MapReduce模式中谈海量数据处理(含淘宝技术架构)

 文章转载自: http://blog.csdn.net/v_july_v/article/details/670407 从hadoop框架与MapReduce模式中谈海量数据处理 前言     几周前,当我最初听到,以致后来初次接触Hadoop与MapReduce这两个东西,我便稍显兴奋,觉得它们很是神秘,而神秘的东西常能勾起我的兴趣,在看过介绍...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注