阿里云文档 2026-04-08

Lindorm Spark SQL节点,Lindorm Spark SQL

DataWorks的Lindorm Spark SQL节点可进行Lindorm Spark SQL任务的开发和周期性调度。本文为您介绍使用Lindorm Spark SQL节点进行任务开发的主要流程。

阿里云文档 2026-02-02

Serverless Spark支持通过自动或手动解冻OSS归档文件,确保SQL作业连续执行,需版本esr-4.4.0及以上。

当Spark作业需读取OSS归档存储中的数据时,因文件处于冻结状态无法直接访问,导致任务失败。本功能支持自动或手动触发解冻流程,确保作业正常执行,提升冷数据处理效率。

阿里云文档 2025-11-19

如何通过Spark SQL读写RDS PostgreSQL数据

云原生数据仓库 AnalyticDB MySQL 版支持提交Spark SQL作业,您可以通过View方式访问自建PostgreSQL数据库或云数据库 RDS PostgreSQL 版数据库。本文以RDS for PostgreSQL为例,介绍如何通过Spark SQL读写RDS for PostgreSQL数据。

阿里云文档 2025-06-19

通过Spark SQL读写Iceberg外表

本文主要介绍如何在云原生数据仓库 AnalyticDB MySQL 版中使用Spark SQL读写Iceberg外表。

阿里云文档 2025-04-17

通过Spark SQL读写SQL Server数据

云原生数据仓库 AnalyticDB MySQL 版支持提交Spark SQL作业,您可以通过View方式访问自建SQL Server数据库或云数据库 RDS SQL Server 版数据库。本文以云数据库 RDS SQL Server 版为例,介绍如何通过Spark SQL访问SQL Server数据。

文章 2016-05-11 来自:开发者社区

Spark-SparkSQL深入学习系列十(转自OopsOutOfMemory)

    /** Spark SQL源码分析系列文章*/     前面讲到了Spark SQL In-Memory Columnar Storage的存储结构是基于列存储的。     那么基于以上存储结构,我们查询cache在jvm内的数据又是如何查询的,本文将揭示查询In-Memory Data的方式。 一、...

Spark-SparkSQL深入学习系列十(转自OopsOutOfMemory)
文章 2016-05-11 来自:开发者社区

Spark-SparkSQL深入学习系列九(转自OopsOutOfMemory)

  /** Spark SQL源码分析系列文章*/     Spark SQL 可以将数据缓存到内存中,我们可以见到的通过调用cache table tableName即可将一张表缓存到内存中,来极大的提高查询效率。     这就涉及到内存中的数据的存储形式,我们知道基于关系型的数据可以存储为基于行...

Spark-SparkSQL深入学习系列九(转自OopsOutOfMemory)
文章 2016-05-11 来自:开发者社区

Spark-SparkSQL深入学习系列八(转自OopsOutOfMemory)

 /** Spark SQL源码分析系列文章*/  在SQL的世界里,除了官方提供的常用的处理函数之外,一般都会提供可扩展的对外自定义函数接口,这已经成为一种事实的标准。   在前面Spark SQL源码分析之核心流程一文中,已经介绍了Spark SQL Catalyst Analyzer的作用,其中包含了ResolveFunctions这个解析函...

Spark-SparkSQL深入学习系列八(转自OopsOutOfMemory)
文章 2016-05-11 来自:开发者社区

Spark-SparkSQL深入学习系列七(转自OopsOutOfMemory)

  /** Spark SQL源码分析系列文章*/   接上一篇文章Spark SQL Catalyst源码分析之Physical Plan,本文将介绍Physical Plan的toRDD的具体实现细节:   我们都知道一段sql,真正的执行是当你调用它的collect()方法才会执行Spark Job,最后计算得到RDD。 [java] vie...

Spark-SparkSQL深入学习系列七(转自OopsOutOfMemory)
文章 2016-05-11 来自:开发者社区

Spark-SparkSQL深入学习系列六(转自OopsOutOfMemory)

  /** Spark SQL源码分析系列文章*/   前面几篇文章主要介绍的是Spark sql包里的的spark sql执行流程,以及Catalyst包内的SqlParser,Analyzer和Optimizer,最后要介绍一下Catalyst里最后的一个Plan了,即Physical Plan。物理计划是Spark SQL执行Spark job的前置,...

Spark-SparkSQL深入学习系列六(转自OopsOutOfMemory)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注