阿里云文档 2024-09-14

什么是Fusion引擎

Fusion引擎是EMR Serverless Spark内置的高性能向量化SQL执行引擎,相比开源Spark在TPC-DS基准测试上有2倍性能提升。Fusion引擎与开源完全兼容,您无需对现有代码做任何修改。在EMR Serverless Spark中,只需在创建Compute或新建开发时选择集成了Fusion引擎的版本,即可启用该引擎。

阿里云文档 2024-08-28

引擎版本介绍

阿里云EMR Serverless Spark采用的是基于Apache Spark引擎。本文为您详细介绍引擎版本号及含义。

阿里云文档 2024-06-18

如何重建,编辑,删除MaxCompute数据源

前置条件了解MaxCompute(原ODPS) ,如果您对MaxCompute 没有过多的了解,可点击此处进行参考。点击此处表权限,在配置MaxCompute 数据表时需要登录OpenSearch的账号对该表有相应的权限(describe,select,download,字段的label权限)。赋权...

阿里云文档 2024-04-28

如何在Spark3服务中开启Native引擎,有哪些限制

本文为您介绍Spark Native引擎在使用过程中的限制,以及如何在Spark3服务中开启Native引擎。

阿里云文档 2023-08-09

MaxCompute多引擎Schema的基本操作

Schema是MaxCompute介于项目和表、资源、函数之间的概念,对表、资源、函数进行进一步归类。本文为您介绍Schema的基本操作。

文章 2022-10-20 来自:开发者社区

大数据平台的SQL查询引擎有哪些—SparkSQL

Spark架构作为大数据处理计算的大一统软件栈Spark,或将是大数据处理领域里面的Spring framework。我们从下图中可以看到Spark core之上具有了四种面向不同计算领域或方式的Spark模块,Spark streaming模块面向实时流计算,具体方式采用微批处理;MLlib模块面向Spark的机器学习库,尤...

大数据平台的SQL查询引擎有哪些—SparkSQL
文章 2022-10-20 来自:开发者社区

大数据平台的SQL查询引擎有哪些(二)

其他特性对比Presto也是完全基于内存的并行计算,注意内存保护,根据数据量情况,为每个节点设置合适的内存大小,否则大数据量情况下,内存溢出就是家常便饭;Impala2.0之后支持内存不够情况,数据吐给磁盘,虽然有了可靠性保护,但是内存与磁盘的I/O交换会带来更慢的吞吐。...

大数据平台的SQL查询引擎有哪些(二)
文章 2022-10-20 来自:开发者社区

大数据平台的SQL查询引擎有哪些(一)

前言大数据平台中Hadoop的分布式文件系统(HDFS)之上形成了一种极具特色的技术群体,那就是SQL查询引擎。这就包括了Hive、Impala、Presto、Spark SQL等;在分布式数据库HBase也具有Impala、phoenix这样的SQL外观,可以通过SQL与HBase交互;另外分布式关系模型数据库...

大数据平台的SQL查询引擎有哪些(一)
文章 2017-05-02 来自:开发者社区

《Spark大数据分析:核心概念、技术及实践》一1.6 分布式SQL查询引擎

$stringUtil.substring( $!{XssContent1.description},200)...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注