阿里云文档 2026-01-13

创建HADOOP_MR离线计算任务-智能数据建设与治理 Dataphin-阿里云

本文为您介绍如何基于Dataphin构建MapReduce on Yarn类型的离线计算任务。

阿里云文档 2026-01-13

元数据仓库共享模型(Hadoop/StarRocks等计算引擎)-智能数据建设与治理 Dataphin-阿里云

本文为您介绍Hadoop计算引擎下提供的元数据共享模型详情。概述为了支持更灵活的数据分析及二次开发,需要使用Dataphin的元数据信息。Dataphin以元数据共享模型的方式将系统元数据对外开放。元数据共享模型的使用方式请参见元数据仓库共享模型。元数据仓库共享模型使用说明共享模型表每个分区存储全量...

阿里云文档 2026-01-06

配置Hadoop计算源以绑定项目空间-智能数据建设与治理 Dataphin-阿里云

Hadoop计算源用于绑定Dataphin项目空间与Hadoop项目,为Dataphin项目提供处理离线计算任务的计算源。如果Dataphin系统的计算引擎设置为Hadoop,则只有项目空间添加了Hadoop计算源,才支持规范建模、即席查询、Hive任务、通用脚本等功能。本文为您介绍如何新建Hadoop计算源。

阿里云文档 2026-01-04

配置Hadoop计算引擎完成元仓初始化-Dataphin-阿里云

Dataphin元数据仓库(简称:元仓),是统一管理Dataphin内部业务元数据和相应计算引擎元数据的数据仓库,存在于Dataphin元仓租户中(OPS租户)的一个Dataphin项目空间中,由一系列的周期性数据集成节点、SQL脚本节点、Shell节点组成。元仓初始化即配置Dataphin系统的计算引擎类型并初始化元数据的过程。本文将为您介绍如何使用Hadoop作为元仓计算引擎进行元仓初始化。

阿里云文档 2025-11-18

查看物理视图资产详情-智能数据建设与治理Dataphin-阿里云

本文为您介绍如何查看计算引擎为MaxCompute、Hadoop、Lindorm(计算引擎)、GaussDB(DWS)、Databricks、Amazon EMR时的物理视图和字段资产详情。

文章 2024-02-07 来自:开发者社区

Hadoop快速入门——第一章、认识Hadoop与创建伪分布式模式(Hadoop3.1.3版本配置)

操作位置 声明,为方便操作,所有内容都在【/opt】文件夹下。 cd /opt 上传压缩包 ...

Hadoop快速入门——第一章、认识Hadoop与创建伪分布式模式(Hadoop3.1.3版本配置)
文章 2022-11-07 来自:开发者社区

Hadoop快速入门——第二章、分布式集群(第二节、Hadoop分布式模式搭建)(2)

3、启动关闭防火墙三台机器分别关闭防火墙【systemctl stop firewalld】禁止启动防火墙三台机器分别禁用防火墙【systemctl disable firewalld】格式化namenode三台机器分别执行【source /etc/profile.d/hadoop-eco.sh】主机master执行【hdfs namenode -format】执行启动脚本master执行:【s....

Hadoop快速入门——第二章、分布式集群(第二节、Hadoop分布式模式搭建)(2)
文章 2022-11-07 来自:开发者社区

Hadoop快速入门——第二章、分布式集群(第二节、Hadoop分布式模式搭建)(1)

前置内容:1、java环境2、hadoop环境配置【vi /etc/profile.d/hadoop-eco.sh】JAVA_HOME=/opt/jdk PATH=$JAVA_HOME/bin:$PATH HADOOP_HOME=/opt/hadoop PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH执行脚本【source /etc/profile.d/....

Hadoop快速入门——第二章、分布式集群(第二节、Hadoop分布式模式搭建)(1)
文章 2022-11-07 来自:开发者社区

Hadoop快速入门——第一章、认识Hadoop与创建伪分布式模式(3)

6、配置【yarn-site.xml】文件vi hadoop/etc/hadoop/yarn-site.xml添加以下编码:<!-- resourcemanager所在机器 --> <property> <name>yarn.resourcemanager.hostname</name> <value>localhost&l...

Hadoop快速入门——第一章、认识Hadoop与创建伪分布式模式(3)
文章 2022-11-07 来自:开发者社区

Hadoop快速入门——第一章、认识Hadoop与创建伪分布式模式(2)

2、配置SSH免登陆 ssh-keygen -t rsa出现让输入就直接回车就行 将秘钥拷贝到本机ssh-copy-id -i root@localhost需要输入【yes】与【root密码】 ssh验证:ssh 'root@localhost'3、Hadoop安装伪分布式与分布式模式的区别是:【NameNode】和【DataNode】分别运行在不同的计价器上,【NameNode】负责管理所有的....

Hadoop快速入门——第一章、认识Hadoop与创建伪分布式模式(2)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注