阿里云文档 2024-09-14

什么是Fusion引擎

Fusion引擎是EMR Serverless Spark内置的高性能向量化SQL执行引擎,相比开源Spark在TPC-DS基准测试上有2倍性能提升。Fusion引擎与开源完全兼容,您无需对现有代码做任何修改。在EMR Serverless Spark中,只需在创建Compute或新建开发时选择集成了Fusion引擎的版本,即可启用该引擎。

阿里云文档 2024-08-28

引擎版本介绍

阿里云EMR Serverless Spark采用的是基于Apache Spark引擎。本文为您详细介绍引擎版本号及含义。

阿里云文档 2024-06-18

如何重建,编辑,删除MaxCompute数据源

前置条件了解MaxCompute(原ODPS) ,如果您对MaxCompute 没有过多的了解,可点击此处进行参考。点击此处表权限,在配置MaxCompute 数据表时需要登录OpenSearch的账号对该表有相应的权限(describe,select,download,字段的label权限)。赋权...

阿里云文档 2024-04-28

Spark Native引擎使用

请注意,EMR on ECS形态已下线Spark Native引擎。目前,仅在EMR Serverless Spark形态提供Fusion Engine(Spark Native Engine)。更多信息,请参见什么是EMR Serverless Spark。

阿里云文档 2023-08-09

MaxCompute多引擎Schema的基本操作

Schema是MaxCompute介于项目和表、资源、函数之间的概念,对表、资源、函数进行进一步归类。本文为您介绍Schema的基本操作。

文章 2022-06-13 来自:开发者社区

详解大数据采集引擎之Sqoop&采集oracle数据库中的数据

一、Sqoop的简介:Sqoop是一个数据采集引擎/数据交换引擎,采集关系型数据库(RDBMS)中的数据,主要用于在RDBMS与HDFS/Hive/HBase之间进行数据传递,可以通过sqoop import命令将RDBMS中的数据导入到HDFS/Hive/HBase中,也可以通过sqoop exp...

文章 2022-06-13 来自:开发者社区

带你看懂大数据采集引擎之Flume&采集目录中的日志

一、Flume的介绍:Flume由Cloudera公司开发,是一种提供高可用、高可靠、分布式海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于采集数据;同时,flume提供对数据进行简单处理,并写到各种数据接收方的能力,如果能用一句话概括Flume&#x...

文章 2022-02-17 来自:开发者社区

带你看懂大数据采集引擎之Flume&采集目录中的日志

$stringUtil.substring( $!{XssContent1.description},200)...

文章 2022-02-17 来自:开发者社区

详解大数据采集引擎之Sqoop&采集oracle数据库中的数据

$stringUtil.substring( $!{XssContent1.description},200)...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注