阿里云文档 2024-09-06

DataWorks中EMR Serverless Spark用户画像系统中对数据加工成所需数据

本文为您介绍如何用Spark SQL创建外部用户信息表ods_user_info_d_spark以及日志信息表ods_raw_log_d_spark访问存储在私有OSS中的用户与日志数据,通过DataWorks的SparkSQL节点进行加工得到目标用户画像数据,阅读本文后,您可以了解如何通过SparkSQL来计算和分析已同步的数据,完成数仓简单数据加工场景。

阿里云文档 2024-09-05

DataWorks中如何同步数据至EMR Serverless Spark

本教程以MySQL数据源中的用户基本信息ods_user_info_d表和HttpFile中的网站访问日志数据user_log.txt文件为例,通过数据集成离线同步任务分别同步至私有OSS中,再通过Spark SQL创建外部表来访问私有OSS数据存储。本章节旨在完成数据同步操作。

阿里云文档 2024-08-29

Hologres数据访问权限管控

DataWorks为您提供访问Hologres数据时的权限管控能力,包括设置授权身份、权限申请、权限审批,还支持您查看权限申请记录、权限审批记录。本文为您详细介绍Hologres数据访问权限管控。

阿里云文档 2024-08-16

JSON解析组件可以在来源与去向组件间新增JSON解析组件来解析来远侧的JSON数据。

DataWorks数据集成实时ETL支持JSON解析组件使用,可以在来源与去向组件间新增JSON解析组件,对来源侧的JSON数据解析成相应的表数据。

阿里云文档 2024-08-14

DataWorks 数据集成实时 ETL 支持数据过滤组件使用

DataWorks数据集成实时ETL支持数据过滤组件使用,可以在来源与去向组件间新增数据过滤组件按配置的过滤规则,按字段对数据进行过滤。

文章 2024-07-17 来自:开发者社区

DataWorks产品使用合集之怎么离线同步MongoDB的增量数据?

问题一:如何在dataworks 离线同步mongdb 增量数据的同步 ? 如何在dataworks 离线同步mongdb 增量数据的同步 ? 参考回答: 在DataWorks中,您可以使用DataSync(数据同步)功能来离线同步MongoDB的增量数据。以下是一些基本步骤: 创建数据源:首先,您需要在DataWorks中创建一个...

DataWorks产品使用合集之怎么离线同步MongoDB的增量数据?
文章 2024-07-17 来自:开发者社区

DataWorks产品使用合集之在进行离线同步数据时,出现字段中间部分被隐藏的情况,该如何解决?

问题一:DataWorks迪拜region有迁移助手吗? DataWorks迪拜region有迁移助手吗?我没找到 参考回答: DataWorks确实提供了迁移助手功能,可以帮助用户实现任务的上云和跨环境迁移,包括跨云、跨Region、跨账号的迁移。具体来说: 任务上云:DataWorks迁移助手支持将现有的开源调度引擎作业迁移到D...

DataWorks产品使用合集之在进行离线同步数据时,出现字段中间部分被隐藏的情况,该如何解决?
文章 2024-06-09 来自:开发者社区

DataWorks产品使用合集之开发环境执行离线同步不立即更新数据,是什么原因

问题一:DataWorks刷新数据地图的元数据? DataWorks刷新数据地图的元数据? 参考回答: DataWorks数据地图是一个基于元数据的企业数据目录管理模块,它提供了全局数据检索、元数据详情查看、数据预览、数据血缘和数据类目管理等功能。为了采集和管理不同系统中的元数据,DataWorks提供了元数据采集功能。在工作空间中绑定引擎或新建数据源...

DataWorks产品使用合集之开发环境执行离线同步不立即更新数据,是什么原因

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

大数据开发治理平台 DataWorks数据相关内容

大数据开发治理平台 DataWorks更多数据相关

产品推荐

DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。作为阿里巴巴数据中台的建设者,DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论,同时与数万名政务/金融/零售/互联网/能源/制造等客户携手,助力产业数字化升级。

+关注