阿里云文档 2025-10-16

Serverless Spark 提供多种内置函数,包括兼容开源函数和特有函数,用于高效处理数据,如 PARQUET_SCHEMA、PARQUET_METADATA、URL_DECODE 等,支持复杂数据操作与解析。

Serverless Spark 内置了多种函数,能够满足大部分数据处理需求。本文将为您介绍 Serverless Spark 内置提供的函数及其使用说明。

问答 2024-08-19 来自:开发者社区

商业版Delta Engine和Spark引擎与开源版本相比有何优势?

商业版Delta Engine和Spark引擎与开源版本相比有何优势?

问答 2023-11-16 来自:开发者社区

Flink CDC有信创要求的,能用hadoop flink spark 这些开源组件吗?

Flink CDC有信创要求的,能用hadoop flink spark 这些开源组件吗?

问答 2023-01-16 来自:开发者社区

如果我开源Spark+JindoSDK+开源MINIO,有加速效果么?

如果我开源Spark+JindoSDK+开源MINIO,有加速效果么?

文章 2023-01-11 来自:开发者社区

《从Spark到Kubernetes MaxCompute 的云原生开源生态实践之路》电子版地址

《从Spark到Kubernetes MaxCompute 的云原生开源生态实践之路》从Spark到Kubernetes MaxCompute 的云原生开源生态实践之路 电子版下载地址: https://developer.aliyun.com/ebook/3275 电子书: </div>

《从Spark到Kubernetes MaxCompute 的云原生开源生态实践之路》电子版地址
问答 2022-12-07 来自:开发者社区

开源大数据平台E-MapReduce从Spark导入数据至ClickHouse

开源大数据平台E-MapReduce从Spark导入数据至ClickHouse

文章 2022-09-26 来自:开发者社区

向量化执行引擎框架 Gluten 宣布正式开源,并亮相 Spark 技术峰会

“Kyligence 企业级产品源自 Apache Kylin,今天,两者在离线数据处理、即时查询分析等方面,都深度集成了 Spark 的能力。通过 Gluten 这一开源项目,Kylin 和 Kyligence 企业级产品将有效提升 OLAP 查询性能和执行效率,尤其是在云原生版本 Kyligence Cloud 中,将更大程度地降低整体拥有成本(TCO),提高云端数据分析的成本效率,加速大型....

向量化执行引擎框架 Gluten 宣布正式开源,并亮相 Spark 技术峰会
问答 2022-09-07 来自:开发者社区

我现在用开源spark读取hive是这样配置的 用EMR 内置的spark想读取hive数据该怎么弄

我现在用开源spark读取hive是这样配置的 用EMR 内置的spark想读取hive数据该怎么操作呢 官网没找到代码配置

文章 2022-05-06 来自:开发者社区

OPPO 开源高可用、高性能的 Spark Remote Shuffle Service

大数据计算的兴起,源于 Google 的 MapReduce 论文,MapReduce 的原理很简单,其流程核心则是 Map 和 Reduce 两阶段数据交换,也即 Shuffle。Shuffle 对大数据计算影响很大,从公开的资料:Facebook[1]、LinkedIn[2]、阿里[3] 等公司的数据看,Shuffle 影响的任务和任务计算时间上都有较高占比。从 OPPO 的线上任务看,68....

OPPO 开源高可用、高性能的 Spark Remote Shuffle Service
问答 2022-02-15 来自:开发者社区

MaxCompute Spark它与开源系统相同的使用体验是什么意思呢?

MaxCompute Spark它与开源系统相同的使用体验是什么意思呢?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注