优越弹性数据湖分析Spark引擎支持Job级别的弹性,可设置长期保有资源(MIN)、弹性资源上限(MAX),MIN最小为0,实例可自动根据业务波峰波谷在MIN 与 MAX 之间弹性扩缩容,无需提前预留资源,降低成本的同时保持业务稳定运行;同时支持秒级拉起,目前每分钟可以拉起500~1000个计算节点,可以快速响应业务资源需求。
元信息发现可以自动为OSS上面的数据文件创建及更新数据湖元数据,方便分析和计算。具有自动探索文件数据字段及类型、自动映射目录和分区、自动感知新增列及分区、自动对文件进行分组建表的能力。
多源数据实时入湖分析支持构建实时数据湖,延迟大约为10分钟;无需ETL,可使用SQL跨OSS、关系数据库(PostgreSQL、MySQL等)、NoSQL(TableStore等)多种数据源分析,屏蔽各种数据源访问的差异性;分析环境与生产库隔离,分析过程不会对数据源端的业务系统产生造成影响。