阿里云文档 2026-01-12

调用ListCrawlerTypes接口获取数据地图的元数据采集器类型列表-大数据开发治理平台 DataWorks-阿里云

查询数据地图支持的元数据采集器类型列表,其中包含元数据采集器类型,及给定类型支持的子类型和子类型之间的层级关系信息。

阿里云文档 2025-11-10

External Catalog采集方式

数据地图针对External Catalog的元数据采集目前为间接关联形式,如果您在StarRocks类型数据库中已使用External Catalog能力,并期望在数据地图中通过StarRocks数据源类型作为来源,查看其External Catalog下的表及元数据详情,可通过本文进行操作配置。配置并采集完成后,可利用数据地图的搜索功能,搜索和查看StarRocks External Cata...

阿里云文档 2025-06-27

同步数据、EMR 如何通过DataWorks同步日志数据至EMR引擎

本文为您介绍如何新建HttpFile和MySQL数据源来访问本教程所提供的用户信息与网站日志数据,配置数据同步链路至私有OSS数据源,并通过EMR Hive节点建表查询同步后的数据,完成数据同步的操作过程。

阿里云文档 2025-06-27

用户画像分析案例同步用户和日志数据

本教程以MySQL中的用户基本信息ods_user_info_d表和OSS中的网站访问日志数据user_log.txt文件为例,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d_odps、ods_raw_log_d_odps表。旨在介绍如何通过DataWorks数据集成实现异构数据源间的数据同步,完成数仓数据同步操作。

问答 2024-05-06 来自:开发者社区

大数据计算MaxCompute实时增量采集MYSQL binlog用的是streamx 的 吗?

大数据计算MaxCompute实时增量采集MYSQL binlog用的是streamx 的 streamx-pump?我看gitee上的描述这个组件还在规划中?

阿里云文档 2024-03-15

如何在调度系统中使用EMR Doctor

创建EMR集群时,已默认安装EMR Doctor环境并开通EMR Doctor任务信息采集用于健康度评估,但部分客户端参数配置可能导致任务采集失效。本文为您介绍如何在客户端追加采集参数以保证EMR Doctor任务采集正常工作。

文章 2024-01-11 来自:开发者社区

大数据数据库增量日志采集之Canal

1. Canal 入门1.1 什么是 CanalCanal 是用 Java 开发的基于数据库增量日志解析,提供增量数据订阅&消费的中间件。目前。Canal 主要支持了 MySQL 的 Binlog 解析,解析完成后才利用 Canal Client 来处理获得的相关数据。1.2 MySQL 的 Binlog1.2.1 什么是 BinlogMySQL 的二进制日志可以说 MySQL 最重要的....

大数据数据库增量日志采集之Canal

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注