Databricks,Databricks数据洞察,Databricks DataInsight,Spark,全托管Spark,机器学习,MLlib,Delta,ETL,数据湖,数据仓库,实时数仓

精心打造的功能

全托管分析平台

快速拉起Spark全托管的集群,操作简单,按需付费。

集群规模

用户根据需求设置节点数量,支持集群高可用。

机型选择

支持ECS通用型、计算型和内存型三种实例规格族。

弹性能力

集群规模可动态扩展,调整计算资源大小,达到成本最优。

交互式协同工作

多种用户角色共享数据,交互式协同合作。

Notebook

可以协同工作的工作空间,交互式的作业执行方式,支持Spark、PySpark、Spark R和Spark SQL类型的作业,分析结果可视化展示。

统一元数据

集群之间共享数据库、表的元信息,无需重复创建。

完全兼容Spark生态

100%兼容开源Spark,迁移成本低,性能表现优异。

Databricks Runtime

在Apache Spark基础上做了大量的性能优化,且针对阿里云OSS做了I/O优化,提供了更快速、更高效的计算引擎。

Databricks Delta Lake

较开源Delta Lake,功能更完备,对核心功能点均有更深度的优化和性能提升。

企业安全性

与阿里云RAM集成,可以根据用户和角色做权限控制,保障数据安全性。