大数据开发治理平台 DataWorks

大数据开发治理平台 DataWorks基于MaxCompute/EMR/MC-Hologres等数据计算引擎,为客户提供专业高效、安全可靠的一站式大数据开发与治理平台,自带阿里巴巴数据中台与数据治理最佳实践,赋能各行业数字化转型。每天阿里巴巴集团内部有数万...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

API概览

本产品(大数据开发治理平台 DataWorks/2024-05-18)的OpenAPI采用 RPC 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能...

概述

EMR数据开发于2022年2月21日停止功能更新,2023年9月30日停止全面支持。如果您在2022年2月21日21点前未使用过数据开发功能,推荐您通过EMR Workflow进行...您也可以迁移到大数据开发治理平台DataWorks,详情请参见 EMR数据开发停止更新公告。

技术架构选型

在数据模型设计之前,您需要首先完成技术架构的选型。本教程中使用阿里云数据产品MaxCompute配合...MaxCompute作为整个大数据开发过程中的离线计算引擎。DataWorks则包括数据开发、数据质量、数据安全、数据管理等在内的一系列功能。

ETL工作流快速体验

案例提供的数据仅用于阿里云大数据开发治理平台DataWorks数据应用体验。仅 空间管理员 角色可导入ETL模板至目标工作空间。如需给账号授予空间管理员角色,请参见 空间级模块权限管控。导入ETL工作模板时选择的资源组若是Serverless资源组,...

相关的云服务

DataWorks作为阿里云一站式大数据开发与治理平台,通常会与计算引擎产品联合使用,此外使用DataWorks进行数据集成时通常联合进行数据传输的数据源产品一起使用。本文为您介绍典型场景下,使用DataWorks时通常会使用到的其他云产品。计算...

EMR数据开发停止更新公告

2022年2月21日21点起,E-MapReduce(简称EMR)数据开发功能停止更新,进入维护状态,会影响创建项目、新建和运行作业、工作流、数据开发运维等功能。如果您还在使用数据开发功能,请尽快迁移到DataWorks构建数据开发平台。本文为您介绍数据...

视频列表

DataWorks数据安全之MaxCompute数据访问控制介绍 DataWorks任务运维介绍 DataWorks迁移助手介绍 2022年02月 一站式大数据开发治理平台DataWorks入门 2021年04月 DataWorks 安全模式绑定EMR计算引擎 2020年11月 DataWorks数据模型介绍及实践...

DataWorks准备工作

DataWorks是为您提供专业高效、安全可靠的一站式大数据开发与治理平台,使用其进行数据开发前,您需做好相关准备工作,保障后续开发任务可顺利执行。本文为您介绍DataWorks的购买及环境准备流程,帮助您快速开通DataWorks并准备所需开发...

DataWorks模块使用说明

数据开发 数据开发(新版:参加公测)数据开发 是一站式大数据开发系统,支持在线开发 多种数据引擎 的数据处理任务,包括MaxCompute、E-MapReduce、Hologres、Flink 和AnalyticDB。环境隔离:开发和生产环境严格分离,确保生产任务的...

实现开发生产等多套环境隔离

使用DataWorks进行大数据开发时,支持对开发、测试、生产等环境进行隔离,当您联合使用了其他阿里云产品时,也可根据环境隔离诉求进行对应业务的环境设置与隔离,本文以DataWorks联合EMR、OSS等产品为例,为您介绍如何实现开发生产等多套...

使用OpenAPI

本文为您介绍使用大数据开发治理平台DataWorks OpenAPI的基本信息、使用限制、计费及调用说明。基本信息 版本 OpenAPI门户 支持的API列表 支持的地域 2024-05-18(新版OpenAPI)OpenAPI门户 支持的API列表 华东1(杭州)、华东2(上海)、...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴数据建设方法论,支撑数据中台建设,同时与...

云产品集成

大数据开发治理平台 DataWorks DataWorks 是一款为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。您可以使用 DataWorks 添加 ApsaraDB For OceanBase 数据源,管理 OceanBase 数据库中的数据,通过数据集成...

DataWorks on EMR Serverless StarRocks最佳实践

了解DataWorks on EMR Serverless StarRocks DataWorks作为阿里云一站式大数据开发治理平台,通过数据源对接EMR Serverless StarRocks,可实现EMR Serverless StarRocks的数据集成、作业周期性调度,同时结合StarRocks引擎在数据分析和数据...

大数据开发治理平台 DataWorks系统权限策略参考

本文描述大数据开发治理平台 DataWorks支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云...

DataWorks On EMR使用说明

背景信息 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。阿里云...

大数据AI公共数据集分析

操作难度 低 所需时间 30分钟 使用的阿里云产品 DataWorks:一站式大数据开发与治理平台,创建数据源并在数据开发绑定数据源后可在DataWorks上开发调度对应引擎的数据开发治理任务。MaxCompute:适用于数据分析场景的企业级SaaS模式云数据...

DataWorks on EMR数据安全方案

数据安全能力:任务管理 DataWorks提供了大数据开发运维等能力,其中工作空间、安全中心等功能模块可实现对数据计算任务的管理。工作空间:通过DataWorks的工作空间规划可以实现工作空间的人员管理、设置数据作业可见性和可运维性。...

实验介绍

开发调度产品 一站式大数据开发治理DataWorks。在本实验中对原始数据进行同步、加工、质量监控、数据消费等操作与使用任务调度的数据中台。产品详情请参见 什么是DataWorks。工作流设计 在本实验中,您可以根据现有不同引擎选择不同版本的...

DataWorks快速入门

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。本文以DataWorks的部分核心功能为例,指导您使用DataWorks接入数据并进行业务处理、...

快速体验

涉及产品 本案例涉及以下产品:一站式大数据开发治理DataWorks 本案例通过DataWorks实现数据同步、加工、质量监控,以及数据可视化展现,您需提前开通该服务。详情请参见 开通DataWorks服务。云原生数据计算服务MaxCompute 实现底层加工...

OpenLake解决方案快速体验

产品列表 OpenLake免费试用会为您开通如下列表内的产品:分类 产品 开发平台 大数据开发治理平台DataWorks(DataWorks计费说明、DataWorks基础版、DataWorks通用资源组)、人工智能平台PAI 存储服务 数据湖构建DLF、对象存储OSS 计算资源 ...

准备环境

本实验提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。MaxCompute环境准备 开通MaxCompute产品 本案例采用MaxCompute进行实验,请确保您已拥有MaxCompute项目,若您没有MaxCompute实例,则...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

API概览

本产品(大数据开发治理平台 DataWorks/2020-05-18)的OpenAPI采用 RPC 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能...

同步数据

进入数据开发 登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据开发与治理 数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。步骤一:设计业务流程 设计业务流程 新建业务流程。数据开发需基于业务流程使用对应的...

通过函数计算节点实现GitHub实时数据分析与结果发送

开通 大数据开发治理平台DataWorks 并创建工作空间(本实践以使用标准模式工作空间为例,简单模式的操作类似)。操作详情请参见 开通DataWorks服务、创建工作空间。开通 云原生数据计算服务MaxCompute,并创建MaxCompute项目。操作详情请...

同步数据

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据,并且只支持在数据集成模块读取数据。章节目标 将MySQL存储的用户基本信息及OSS存储的网站访问日志数据,通过数据集成服务同步至...

准备环境

DataWorks产品准备 本案需确保您已开通DataWorks产品,若您账号下没有DataWorks产品,需在 大数据开发治理平台 DataWorks 页面进行开通,详情请参见:购买指引。EMR Serverless Spark 工作空间 准备 本案例采用EMR Serverless Spark进行...

准备环境

前提条件 大数据开发治理平台DataWorks:购买DataWorks,详情请参见 购买指引。说明 因本示例提供的数据资源都在华东2(上海),建议购买时选择地域为华东2(上海)。对象存储OSS:已开通OSS服务,具体步骤,请参见 开通OSS服务。步骤一:...

数据开发

本文从需求分析、规划业务流程、规划表管理、同步数据以及加工数据几方面,为您介绍数据开发。需求分析 将MySQL的数据采集到MaxCompute 贴源层表中,进行清洗和加工,产出最终的概览应用表。规划业务流程 业务流程是DataWorks针对业务实体...

数据开发与运维中心:数据加工

任务监控与定位处理 计费 进行数据开发与运维可能产生的费用包括:调度费用:若任务发布至生产环境调度运行,会产生调度费用,详情请参见 任务调度计费说明。运维监控费用:若任务配置并触发监控规则,会产生监控费用,详情请参见 智能监控...

Quick BI智能报表钉钉数据源请假单据可以看到但是无法...

问题描述 Quick BI智能报表钉钉数据源请假单据可以看到但是...问题原因 钉钉中的单据是一年前的记录,智能报表商业化钉钉数据一年数据。解决方案 核对钉钉单据和智能报表数据完整性只支持核对一年数据。适用于 智能报表 当前环境:高级版

查看账单详情

单击 明细账单 页签,您可以选择 账期 和 产品(产品名称选择 大数据开发治理平台 DataWorks),并勾选 统计项 和 统计周期,然后单击 搜索,查看DataWorks账单汇总信息。账单明细说明 DataWorks包括按量付费和包年包月两种计费方式:类别 ...

创建数据源或注册集群(未参加新版数据开发公测)

您可以在 工作空间列表 页,找到目标工作空间,单击 操作 列的 快速进入,区分是否参加了新版数据开发公测:未参加 新版数据开发公测 参加 新建数据开发公测 单击 操作 列的 快速进入,选择 数据开发,进入数据开发页面。未参加新版数据...

数据计算计费说明

费用产生场景 使用Serverless资源组在以下模块运行计算型任务,会产生相应计算费用数据开发:在数据开发(DataStudio)运行数据计算任务,任务代码执行将产生数据计算费用。数据质量:若数据计算任务配置了数据质量校验规则,执行规则...

数据集成计费说明

费用产生场景 通过如下方式运行数据同步任务,会产生相应同步费用数据开发:在数据开发(DataStudio)运行离线同步任务。数据集成:在数据集成页面运行同步任务。运维中心:在运维中心运行数据集成任务。DataWorks支持的数据同步任务,请...

数据下载

在DataWorks的数据开发(DataStudio)、数据分析、安全中心模块下载的CSV、XLSX格式文件数据将同步保存至数据下载功能。通过该功能,您可将所需历史下载文件重新下载至本地使用,也可追溯历史下载记录的操作详情。前提条件 已通过如下模块...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Tair(兼容 Redis®) 数据传输服务 人工智能平台 PAI 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用