阿里云文档 2026-02-28

在EMR Serverless Spark中使用DLF Iceberg Catalog

本文为您介绍在EMR Serverless Spark集群中如何以Iceberg REST对接 DLF Catalog。

阿里云文档 2025-10-24

本文介绍了使用VS Code、通义灵码和spark-submit工具自动生成PySpark任务代码并提交至EMR Serverless Spark的全流程方法,显著简化了开发与执行复杂度。

通过VS Code、通义灵码以及Serverless Spark提供的spark-submit工具,用户能够快速生成Spark任务代码并将其提交至Serverless Spark进行执行。本文将为您详细介绍如何使用上述工具提交Serverless Spark任务。

阿里云文档 2025-10-16

Serverless Spark 提供多种内置函数,包括兼容开源函数和特有函数,用于高效处理数据,如 PARQUET_SCHEMA、PARQUET_METADATA、URL_DECODE 等,支持复杂数据操作与解析。

Serverless Spark 内置了多种函数,能够满足大部分数据处理需求。本文将为您介绍 Serverless Spark 内置提供的函数及其使用说明。

文章 2025-07-25 来自:开发者社区

阿里云 EMR Serverless Spark:面向 Data+AI 的高性能 Lakehouse 产品

一.业务痛点 在服务了多家企业后,我们总结了共享集群的一些关键痛点。当业务部门同时提交报表生成、BI查询和模型训练任务时,原有的 YARN 集群将面临多重挑战。首先,资源争抢会导致关键任务的延迟,业务方会抱怨数据产出不及时,而在波谷时段又会出现大量资源闲置,但我们仍需为这些闲置资源付费。这种共享集群环境较为脆弱,一旦某个任务失控,可能会导致整个平台瘫痪。其次,这样的集群不利于成...

阿里云 EMR Serverless Spark:面向 Data+AI 的高性能 Lakehouse 产品
文章 2025-06-18 来自:开发者社区

一体系数据平台的进化:基于阿里云 EMR Serverless Spark 的持续演进

一.背景介绍 一体系汽配供应链平台(以下简称一体系),专注提供高品质发动机、变速箱、底盘技术零部件,融汇优质实体资源和创新互联网科技,为上游品牌商提供高效的下沉渠道,为下游零售商带来可信赖的产品和服务,让采购更便捷可靠,实现行业数字化转型。 随着企业对实时数据分析、AI 能力和大规模数据处理的需求不断增长,平台数据量庞大且持续增长、数据呈现半结构化...

一体系数据平台的进化:基于阿里云 EMR Serverless Spark 的持续演进
文章 2025-04-29 来自:开发者社区

鹰角网络:EMR Serverless Spark 在《明日方舟》游戏业务的应用

作者:鹰角网络高级大数据研发 茅旭辉 背景介绍 鹰角网络是一家年轻且富有创新的游戏公司,致力于开发充满挑战性和艺术价值的游戏产品。公司目前涵盖了游戏开发、运营和发行的全生命周期业务。随着业务的扩展,鹰角网络从单一爆款游戏发展到多赛道、多平台、全球化的战略布局,在数据业务上进行了全面的优化和升级。 从业务上看,以《明日方舟》为代表的长线运营游戏,具有相对...

鹰角网络:EMR Serverless Spark 在《明日方舟》游戏业务的应用
文章 2025-02-28 来自:开发者社区

基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用

背       景 随着互联网服务的广泛普及与技术应用的深入发展,日志数据作为记录系统活动、用户行为和业务操作的宝贵资源,其价值愈发凸显。然而,当前海量日志数据的产生速度已经远远超出了传统数据分析工具的处理能力,这不仅要求我们具备高效的数据收集和存储机制,更呼唤着强大、灵活且易用的数据分析平台的诞生。在此背景下,Apache  Spark,这一专为...

基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
文章 2025-02-19 来自:开发者社区

美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台

作者:美的楼宇科技事业部 先行研究中心智能技术部 美的楼宇科技 IoT 数据平台建设背景 美的楼宇科技事业部(以下简称楼宇科技)是美的集团旗下五大板块之一,产品覆盖多联机组、大型冷水机组、单元机、机房空调、扶梯、直梯、货梯以及楼宇自控软件和建筑弱电集成解决方案,远销海内外200多个国家。针对当前设备数据量庞大且持续增长、数据呈现半结构化特点的现状,现有系统仅停留在数据存...

美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注