阿里云文档 2026-06-07

通过离线同步任务实现Embedding向量化处理

阿里云DataWorks数据集成推出Embedding向量化功能,支持将分散在OSS、MaxCompute、HDFS等异构来源中的数据抽取并转化为向量,写入Milvus、Elasticsearch、Opensearch等向量库,以及Hologres向量表等具备向量存储能力的目标端,能够大幅简化ETL流程,高效实现知识向量化,助力RAG等AI场景落地。

阿里云文档 2026-06-02

数据对比节点

DataWorks的数据对比节点可实现对不同表之间的数据进行多种方式的对比,并可在工作流中使用。本文为您介绍使用数据对比节点进行任务开发的主要流程。

阿里云文档 2026-01-12

使用GetIDEEventDetail查询MessageId对应的扩展点事件快照-大数据开发治理平台 DataWorks-阿里云

根据DataWorks开放消息的消息ID,查询触发扩展点事件时的扩展点数据快照。

阿里云文档 2025-12-09

数据过滤或参数设置

在数据质量监控场景中,通常不会将整张表的数据都纳入监控,而是每次监控只过滤出发生变动的数据,本文介绍如何设置数据过滤。

阿里云文档 2025-08-06

DataWorks数据服务创建API时无法选择资源组

问题描述DataWorks数据服务创建API时无法选择资源组。问题原因Serverless资源组数据服务CU限制默认为0,需要为Serverless资源组的数据服务用途分配CU。解决方案进入资源组列表页面。登录DataWorks控制台,切换至目标地域后,单击左侧导航栏的资源组,进入资源组列表页面。D...

文章 2024-06-29 来自:开发者社区

DataWorks产品使用合集之mysql-cdc读取数据写入到datahub中,datahub如何转换时区

问题一:DataWorks数据集成, 同步任务 全量周期性同步,为啥清空表,不是清空整个表的数据? DataWorks数据集成, 同步任务 全量周期性同步,为啥清空表,不是清空整个表的数据? 参考回答: 目前不支持非分区表 truncate都是指定分区 如果只写入a分区 但是清空了所有分区数据 不符合大部分使用场景 如果表不多 可以先尝试单表离线同步 可以使用非...

问答 2024-04-14 来自:开发者社区

DataWorks mysql-cdc读取数据写入到datahub中,datahub怎么转换时区呀?

DataWorks mysql-cdc读取数据写入到datahub中,时间多了八小时,datahub怎么转换时区呀?

问答 2024-03-19 来自:开发者社区

DataWorks数据集成的时候,数据来源的时区和本地时区不同会有什么影响吗?

DataWorks数据集成的时候,数据来源的时区和本地时区不同会有什么影响吗?

问答 2022-12-19 来自:开发者社区

dataworks数仓里的数据全是0时区,这个场景有解决方案吗?

dataworks数仓里的数据全是0时区,这个场景有解决方案吗?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

大数据开发治理平台 DataWorks数据相关内容

大数据开发治理平台 DataWorks更多数据相关

产品推荐

DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。作为阿里巴巴数据中台的建设者,DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论,同时与数万名政务/金融/零售/互联网/能源/制造等客户携手,助力产业数字化升级。

+关注