中国数据治理市场经过几十年的发展,市场需求已经发生了重大转变。过去是面向单个数仓或者 BI 进行数据治理,单个主数据管理、元数据管理、数据集成工具组件就能满足需求。今天,企业内部的数据架构越来越复杂,要做好数据治理需要工程化的解决方案。
数据治理作为行业数字化转型的必经之路,已经引起各行各业的高度重视,越来越多的行业企业开始发起数据治理项目。此外,数据治理与业务场景的结合,与底层大数据存储管理以及上层大数据分析应用的结合越来越密切。随着数据价值的凸显以及整体市场对数据资产变现的重视,数据治理市场也将迎来爆发期。
本报告从中国数据治理市场现状角度出发,分析当前数据治理行业落地现状,典型供应商的市场格局,市场发展的影响因素,以及未来发展趋势。

• 阿里云在数据治理领域主要提供自主研发的全链路大数据开发治理平台 DataWorks。DataWorks 是中国市场上较早的数据治理平台型产品,从 2009 开始在阿里巴巴内部不断积累数据治理经验,并在阿里云上对政府、能源、金融、互联网、零售等多个行业的客户进行方法论与产品化的输出。DataWorks在数据治理领域深度结合 MaxCompute、Hologres、EMR 等大数据计算引擎的能力,构建一体化大数据平台,不断迭代产品能力,提供可量化、可持续、可运营的数据治理闭环,为千行百业的数字化转型提供坚实的数据底座。
阿里云DataWorks 全链路数据开发治理包含 6 大板块能力,覆盖智能数据建模、全域数据集成、高效数据开发、主动数据管理、全面数据安全、快速分析服务的数据全生命周期。
DataWorks作为平台层,通过丰富完整的全链路数据治理工具,提高数据治理工作的便捷性,而阿里云各类大数据引擎通过不断地追求性能的极致优化,打破了数据量随成本的线性增长。云原生大数据计算服务MaxCompute单日数据处理量已经达到1.7EB,仅用10%的机器增长,支撑阿里巴巴75%的数据量增长,并且连续5年打破TPCx-BigBench 100TB规模性能世界记录。同时Hologres作为实时数仓,双11峰值每秒写入5.96亿条,单表存储高达2.5PB,基于万亿级数据对外提供多维分析和服务,99.99%的查询可以在80ms以内返回结果。Hologres与MaxCompute组成离线实时一体化的数据仓库,从底层就极大地简化了大数据架构的复杂度。E-MapReduce针对开源引擎进行性能优化,如Spark SQL较开源版本提升6倍,连续两年打破TPC-DS世界纪录,成为全球首个通过TPC认证的公共云产品。DataWorks与各类大数据计算引擎构建的一体化大数据平台,通过云上开箱即用的Serverless能力,让企业能够快速地完成并落地数据治理相关的工作。
企业数字化转型正在进入深水区,数据作为核心生产要素,不断增长的数据量已经造成了极大的成本与效率的压力,阿里云正在与各行各业的客户及合作伙伴一起,通过全链路数据治理,让企业管得好数据、用得好数据,让数据从低质低效向高质高效流动。