阿里云大数据
播放视频
为业务敏捷而生的简单、易用、全托管的云原生大数据服务,包括阿里云自研一体化大数据智能计算平台ODPS和云原生开源大数据产品体系。激活数据生产力,分析产生业务价值。

产品优势

使用阿里云大数据平台,更快速地解决海量数据计算问题,有效降低企业成本,并保障数据安全。
企业级安全
访问控制、应用安全、风控审计、数据安全
SaaS化开箱即用
开箱即用的在线服务、加速构想验证和产品交付
随意弹性
Serverless资源池、作业级别按需秒级扩展
开放兼容
兼容Hive/Spark、丰富数据和管理接口、一键导出

最新资讯

产品家族

阿里云ODPS
开源大数据产品
阿里AI
阿里云ODPS
MaxComputeODPS大规模批量计算引擎
SaaS模式云数仓解决方案,高效处理海量数据
实时数仓HologresODPS实时交互式计算引擎
提供离在线一体化全栈数仓解决方案
DataWorks 数据开发
一站式大数据开发&治理平台
实时计算 Flink 版实时计算
Flink创始团队出品,秒处理能力25.5亿条
数据湖构建 Data Lake Formation集中式存储库
帮助用户简单快速地构建云原生数据湖解决方案
数据总线DataHub数据同步
流式数据的发布和订阅

应用场景

云原生一体化数仓
离线实时一体化
分析服务一体
湖仓一体
全链路数据治理
云原生数据湖
云原生一体化数仓
云原生一体化数仓是集阿里云大数据产品MaxCompute、DataWorks、Hologres和实时计算Flink版等产品能力于一体的一站式大数据处理平台。
能够提供
通过ODPS大规模批量计算引擎MaxCompute和ODPS实时交互式计算引擎Hologres的深度融合,提供丰富和灵活的离线实时一体化的能力。
通过更加开放的对数据湖的支持以及对数据分析多样化统一管理的湖仓一体能力。
通过一份数据的基础不断追求对数仓的实时化和在线化的能力结合。
通过DataWorks自顶向下和自底向上的双向建模的能力,以及数据治理与企业数据评估模型的新能力来帮助企业更加直观地感受到自身的数据成熟度。
推荐搭配使用
离线实时一体化
以MaxCompute和Hologres为核心的离线实时一体化海量云数仓架构,用1套架构解决了N种场景的需求。MaxCompute擅长EB级海量数仓场景,Hologres擅长高并发低延迟场景,两个引擎在场景和技术上形成补充,相辅相成,最终满足在线应用、数据大屏、运营看板、即席查询等多种场景的要求。
能够提供
MaxCompute和Hologres深度融合技术,通过元数据可见、外表加速、高速直读直写三个角度的技术创新,实现了实时系统与离线系统的数据打通,同时保留了两个系统各自优势的场景能力。
MaxCompute和Hologres 10X性能高速原生互访,深度集成。
MaxComputeEB级海量云数仓的快速查询能力。
推荐搭配使用
分析服务一体
分析服务一体,是通过技术创新,实现数据架构简化的有效思路,实现一份数据,对运营,支持灵活分析,对应用,支持在线服务,实现统一的数据服务出口。
能够提供
数仓实时化、敏捷化、在线化、一体化趋势明显。
一个平台上、一份数据实现灵活探索式分析和高并发在线应用查询,同时实现良好的资源隔离和可用性。
减少数据割裂,减少数据移动,统一数据服务出口。
推荐搭配使用
湖仓一体
湖仓一体旨在将数据湖和数据仓库两种不同的数据管理架构进行融合,从而让企业构建大数据平台时可兼顾数据湖的灵活性和数据仓库的企业成长性。
更易用的湖仓开发体验
DataWorks发布湖仓一体主页,实现基于异构数据平台的一站式数据开发、管理和治理体验。
从提交工单开通模式升级为自助开通模式,实现分钟级打通数仓与数据湖。
更广泛的生态对接
从支持 HDFS 数据湖扩展到支持阿里云 DLF + OSS 数据湖方案,全新支持Delta Lake、Hudi 等主流数据湖格式。
支持和外部数据源整库级别联邦 (RDS Upcoming!)
更高的性能
全新支持智能 Cache + MaxCompute内置查询加速引擎,使数据湖查询性能提升 10+ 倍以上。
更丰富的数据类型
新增非结构化数据的湖仓管理能力。MaxCompute对OSS上非结构化数据进行映射和管理,方便客户灵活的对湖上各种类型数据进行处理、分析和权限管理(Upcoming!)
推荐搭配使用
全链路数据治理
数据综合治理涵盖资产全景、数据地图、智能监控、数据质量、数据安全、资源优化等多个功能模块,提供多种聚焦视角帮助用户轻松构建和管理数据,洞察数据价值。可有效支撑离线大数据仓库构建、数据联邦查询和处理分析、海量数据低频交互式查询&智能报表构建和数据湖方案落地。
一站式平台能力
涵盖7大功能模块,与数据集成、数据开发等联动,可以一站式地完成大数据的开发和治理工作。
灵活性和智能化
与各类引擎的深度集成,提供自研和开源的灵活选择。
AI+增强型数据治理能力,荣获国家专利的智能基线监控技术、数据质量规则智能推荐、元数据自动采集&数据目录的智能构建,可有效确保数据产出准时性、正确性以及有序管理和使用。
多视角使用引导
数据开发、使用、管理多视角使用引导,满足不同人群聚焦使用的需求。
推荐搭配使用
云原生数据湖
阿里云云原生数据湖,由对象存储OSS、数据湖构建Data Lake Formation、E-MapReduce产品强强组合,提供存储与计算分离架构下,湖存储、湖加速、湖管理、湖计算的企业级数据湖解决方案。
丰富的开源引擎
支持Hive /Spark /Presto /Flink 等10+计算引擎。
数据湖计算加速
独有的JindoFS加速能力,大规模集群优于HDFS,让数据分析如同本地一样快速高效。
容器化
支持Spark / Presto on K8s + Spark Remote Shuffle Service ,并经过大规模生产环境实践验证。
推荐搭配使用

最新热门优惠

学习进阶

权威认证

宣传图
The Forrester Wave™

国内唯一挺进Forrester全球云数据仓库Wave卓越表现者象限

2021年3月,MaxCompute、DataWorks 等进入 Forrester Wave 2021 Q1 云数据仓库卓越表现者象限,成为入选此次评测的唯一中国厂商。以 MaxCompute 为核心代表的云数仓已然成为中国受欢迎的云数据仓库服务。

点击查看
宣传图
IDC中国,2021

阿里云获2021中国数据治理平台市场份额第一

IDC发布《中国数据治理市场份额,2021:广泛落地,持续增长》报告,报告统计显示2021 年中国数据治理平台市场规模达 23.9 亿元。阿里云以23.4%份额获得2021中国数据治理平台市场份额第一。

点击查看
宣传图
IDC中国,2021

阿里云大数据公有云市场份额居中国第一

IDC发布了《中国大数据平台公有云服务市场份额概况,2021》,报告显示,阿里云稳居中国大数据平台公有云服务市场第一位,营收达14.9亿元。实时数仓、湖仓一体、流批一体、大数据与AI一体化等技术成为市场关注重点。

点击查看

阿里云ODPS生态建设

ODPS(Open Data Platform and Service)是阿里云一体化大数据智能计算平台,自09年开始建设至今,提供离线计算、实时交互式分析、机器学习等可扩展的智能计算引擎。是目前中国唯一自研,规模最大,能同时支持超过10万台服务器并行计算的大数据平台。
开发语法兼容
支持标准SQL、HIVESQL、PGSQL、Python、MR、Spark等多种开发语言,无缝衔接原有开发方式
多种自定义接口
提供SDK接口、JDBC、OpenAPI等多种灵活开放的对接方式,可自定义开发方式与流程
丰富的分析产品连接
支持Tableau、QuickBI、PowerBI、FineBI等十几种产品,快速完成数据分析与可视展现
开放的合作伙伴生态
与蚂蚁集团、神策、数语等多种生态伙伴产品深度集成,为各种大数据场景提供多维的产品组合

案例和最佳实践

客户案例
小红书
自建ClickHouse迁移Hologres,小红书亿级推荐业务OLAP分析上云实践。查看详情
百草味
百草味基于EMR+Databricks+DLF构建云上数据湖。查看详情
数禾科技
数禾科技基于MaxCompute+DLF+EMR湖仓一体架构实现湖仓计算的自由流动。查看详情
最佳实践
新氧云原生全栈数仓最佳实践
新氧数据中台数据研发部总监 高宏超:自建大数据平台面临困难与挑战,从成本、安全、资产管理及组件可扩展性等综合考量后决定整体迁移到阿里云,上云后总体资源成本降低30%,性能上提升2-3倍。查看详情
“万里牛”实时数仓的演进之路
湖畔网络大数据平台负责人 陈晓亮:我们建设数据中台的原动力是希望积累的数据能够持续产生价值,阿里云提供的大数据产品组件,让我们这种中小规模数据团队也有机会可以支撑大数据业务。查看详情
数字营销行业大数据平台云原生升级实战
加和科技CTO 王可攀:技术是为业务价值而服务。 查看详情

这些客户都在用