产品功能

一站式智能大数据开发治理平台,覆盖数据开发与治理全生命周期。

大数据开发治理平台 DataWorks

    产品功能

    数据建模

    • 快速落地数仓规范

      数仓分层规划与模型设计结合,多个数仓复用一套规范。模型设计与数据研发相融合,快速生成规范的表与代码。

    • 快速构建数据模型

      支持关联字段标准/标准代码的字段在发布生产时自动质量落标。

      支持逆向建模,解决已有数仓建模冷启动的问题。

      同时支持可视化/excel/代码等多种建模方式。

      提供应用层模型建模工具,降低数仓管理的复杂性。

    • 提升数据指标创建效率

      通过界面拖拽可视化批量创建指标,并进行指标重复性检测,避免重复计算。

    数据集成

    • 50+种丰富的异构数据源

      支持关系型数据库、文件存储、大数据存储、消息队列等50种数据源。不限制链路,读写插件都支持。

    • 离线、实时同步全场景覆盖

      全增量一体化实时同步,全量增量数据自动合并,支持分库分表离线实时同步。

    • 齐备的网络解决方案

      提供所有网络场景下的同步解决方案,支持跨产品、跨账号、跨云的数据同步。

    数据开发

    • 大幅提升工作效率

      非技术人员1~2小时即可掌握完整的数据研发流程。无需维护各类开源技术栈,释放更多人力专注于业务。

    • 数据生产稳定性保障

      每日稳定调度千万级别的多引擎、多语言任务。智能基线保障数据产出,全链路任务诊断。

    • 提供更规范、科学的开发模式

      高效的多人协同任务开发模式,规范且安全的任务发布上线流程。

    Notebook

    • 多引擎数据开发
      支持MaxCompute、Spark、Flink、Hologres、StarRocks等多种计算引擎的SQL及Python开发。
    • Data+AI交互式开发
      支持SQL和Python交互式协同开发,一站式实现从数据处理到AI模型训练与应用。
    • 可自定义镜像的个人开发环境
      提供个人开发环境,支持自定义容器镜像,工作空间内部用户之间互不干扰。
    • 数据可视化
      对查询结果集提供便捷的数据可视化图表配置与生成能力。

    数据治理

    • 数据治理量化评估
      从计算、存储、研发、质量、安全5个方面提供健康分。数据治理成效可量化可追溯,提供湖仓资源消耗与异动分析。场景式治理计划,自动跟踪治理目标进展及阶段成果。
    • 数据治理问题自动发现和预防

      阿里巴巴数据治理经验沉淀,提供开箱即用的治理模板。事前治理,内置检查器在数据开发环节提前干预。数据标准自动落标,线上质量问题即时阻断。

    • 数据治理问题高效处理

      提供存量治理问题列表及优化手段,自动化治理流程高效执行。内置37种表级、字段级数据质量规则模板,自动判定动态阈值波动。支持湖仓血缘,表/字段级数据链路查询与排错。

    数据分析

    • 简单快速的数据分析

      支持MaxCompute、Hologres、EMR等多种数据源。自助SQL查询,支持电子表格直接进行快速预览,数据的上传与下载。智能生成SQL命令,高效完成数据查询与可视化分析。

    • 零代码快速构建API

      支持通过可视化的向导模式生成API,也支持通过SQL脚本模式编写复杂查询逻辑生成API。

    • 高效的服务编排
      提供拖拽式的工作流编排能力,以串、并行和分支等结构编排多个API及函数服务为工作流,创建复杂API。

    数据服务

    • 敏捷封装数据接口
      零代码封装API,采用标准HTTP协议,提供查询加速服务,能够稳定并发地提供服务。
    • 灵活数据推送
      丰富的数据来源,可针对多样化渠道自定义播报周期推送,核心指标可直接触达相关业务方。

    数据洞察

    • 智能数据分析查询
      结合大模型技术,通过自然语言指令,即可生成分析SQL查询数据。
    • 海量数据探查
      自动探查海量数据集,无需专业技术即可快速了解数据内容及特征。
    • 智能数据洞察与图表生成
      结合AI技术,数据图表与见解自动生成,提供多样化的可视化表现。
    • 一键构建数据报告
      一键生成数据报告,支持多种精美主题自由切换,以及一键分享。

    任务调度

    • 灵活的调度策略
      支持定时调度与手动调度,定时调度支持小时、分钟、日、周、月等多种调度周期,满足不同场景的调度需求。
    • 大数据+AI混合调度
      支持调度MaxCompute、EMR、CDH、Hologres、AnalyticDB、StarRocks、PAI等计算引擎,形成大数据+AI混合调度。
    • 大规模稳定调度
      支持每日调度千万级规模的数据处理任务。

    任务运维

    • 运维大屏
      直观展示任务运行的核心指标,快速定位异常。
    • 智能监控
      提供智能基线来监控核心业务的数据处理任务,保障核心业务数据在指定时间内顺利产出。
    • 任务运维
      提供重跑、置成功、紧急去除依赖、紧急修改任务优先级、补数据等多种运维手段,便于数据故障快速恢复。
    • 智能诊断
      对任务运行过程中出现的问题进行全链路分析,快速定位问题根源,并提供智能诊断建议。

    Copilot

    • 智能编程助手
      可根据自然语言快速转换为需要的SQL命令,包括SQL生成、SQL改写、SQL纠错、生成注释等,帮助您轻松高效地完成数据ETL及数据分析工作。
    • AI Agents自然语言交互界面
      通过大模型的语义理解与内容生成能力,在找表、建表、图表生成、代码变更描述和函数描述生成等方面提供Agent,提升操作效率和体验。
    免费试用

    想体验更多产品功能?

    立即购买 大数据开发治理平台 DataWorks产品

    了解更多阿里云产品介绍?

    探索 阿里云产品 了解更多产品介绍

    遇到了困难需要帮助?

    联系我们 咨询阿里云服务团队