文章 2024-06-12 来自:开发者社区

【大数据】Hadoop下载安装及伪分布式集群搭建教程

1.概述 hadoop有三种安装模式 单机模式,只在一台机器上运行,存储用的本地文件系统而不是HDFS。 伪分布式模式,存储采用HDFS,名称节点和数据节点在同一台机器上。 分布式模式,标准的分布式集群。 做实验或者学习阶段选择伪分布式就好,本文将详细讲解在Linux搭建起一个伪分布式的hadoop集群。 2.环境准备 ...

【大数据】Hadoop下载安装及伪分布式集群搭建教程
阿里云文档 2024-05-06

通过HTTP协议下载文件并同步至目标数据源

DataWorks数据集成支持HttpFile数据源,可以通过HTTP协议下载文件并同步文件至目标数据源。

基于阿里云MaxCompute搭建数据仓库(离线)

70 课时 |
965 人已学 |
免费

阿里云大数据工程师ACA认证(2023版)

21 课时 |
3726 人已学 |
免费

基于MaxCompute的热门话题分析

8 课时 |
627 人已学 |
免费
开发者课程背景图
阿里云文档 2024-03-27

如何下载数据

在DataWorks的数据开发(DataStudio)、数据分析、安全中心模块下载的CSV、XLSX格式文件数据将同步保存至数据下载功能。通过该功能,您可将所需历史下载文件重新下载至本地使用,也可追溯历史下载记录的操作详情。

阿里云文档 2024-03-08

实时阻断或审批超过1000条数据的下载行为

DataWorks通过OpenEvent能力为您提供消息订阅能力,您可以将服务程序注册为DataWorks的扩展程序,通过扩展程序来捕捉并响应订阅的事件消息,以此实现对特定事件进行消息通知与流程管控。本文以“实时阻断或审批超过1000条数据的下载行为”事件为例,为您介绍风险识别规则从开发到验证的全流程。

阿里云文档 2023-08-09

如何下载相应版本的JindoData

本文为您介绍如何下载相应版本的JindoData。

文章 2023-06-07 来自:开发者社区

大数据数据采集的数据迁移(同步/传输)的Sqoop之下载和配置安装

下载Sqoop 首先,我们需要到官网上下载Sqoop。根据需要选择版本并下载对应压缩包。下载好后,解压到指定目录即可。配置环境变量 安装好Sqoop后,我们还需要配置相应的环境变量,才能够使用Sqoop命令。编辑.bashrc文件,并添加如下内容:export SQOOP_HOME=/path/to/sq...

阿里云文档 2023-01-28

如何配置及使用P2P

JindoFSx客户端P2P可以被视作一种本地缓存(LocalCache)。与原有的LocalCache相比,P2P缓存中的本地数据块会优先从其他持有该数据的客户端拉取,只有无法向其他客户端请求时,才会从STS或远端读取。本文为您介绍P2P分布式下载缓存的使用方法。

问答 2017-10-24 来自:开发者社区

MaxCompute工具及下载:Eclipse开发插件:安装

为了方便用户使用 MapReduce及 UDF的Java SDK进行开发工作,ODPS提供了Eclipse开发插件。该插件能够模拟MapReduce及UDF的运行过程,为用户提供本地调试手段,并提供了简单的模板生成功能。 备注: 目前高版本的Eclipse Neon有可能会导致插件加载失败,请使用Eclipse Luna版本。下载此插件请点击这里。与MapReduce提供的本地运行模式不...

问答 2017-10-24 来自:开发者社区

MaxCompute工具及下载:MaxCompute Studio:快速开始:安装 IntelliJ IDEA

MaxCompute Studio 是阿里云 MaxCompute平台提供的安装在开发者客户端的大数据集成开发环境(IDE)工具,是一套基于流行的集成开发平台 IntelliJ IDEA的开发插件,帮助用户方便地进行数据开发。本文将介绍如何安装 MaxCompute Studio 的基础平台 IntelliJ IDEA。 操作步骤 单击 此链接,下载 IntelliJ IDEA。下载完成...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute下载相关内容

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注