阿里云文档 2025-01-17

Spark SQL交互式查询

如果您需要以交互式方式执行Spark SQL,可以指定Spark Interactive型资源组作为执行查询的资源组。资源组的资源量会在指定范围自动扩缩容,在满足您交互式查询需求的同时还可以降低使用成本。本文为您详细介绍如何通过控制台、Hive JDBC、PyHive、Beeline、DBeaver等客户端工具实现Spark SQL交互式查询。

文章 2025-01-16 来自:开发者社区

Spark SQL向量化执行引擎框架Gluten-Velox在AArch64使能和优化

Spark SQL向量化执行引擎框架Gluten-Velox在AArch64使能和优化 内容分析: 1. 技术背景 2. 算子库构成 3. 算子操作优化 4. 未来工作   01、技术背景 下图描述了当今大数...

Spark SQL向量化执行引擎框架Gluten-Velox在AArch64使能和优化
阿里云文档 2024-12-19

ADB Spark SQL的使用

DataWorks的ADB Spark SQL节点可进行AnalyticDB Spark SQL任务的开发和周期性调度,以及与其他作业的集成操作。本文为您介绍使用ADB Spark SQL节点进行任务开发的主要流程。

阿里云文档 2024-10-17

通过Spark SQL读写Azure Blob Storage外表

本文主要介绍如何在云原生数据仓库 AnalyticDB MySQL 版中使用Spark SQL读写Azure Blob Storage中的数据。

阿里云文档 2024-10-14

Spark SQL诊断优化

云原生数据仓库 AnalyticDB MySQL 版推出Spark SQL诊断功能,若您提交的Spark SQL存在性能问题,您可以根据诊断信息快速定位、分析并解决性能瓶颈问题,优化Spark SQL。本文主要介绍如何进行Spark SQL性能诊断以及性能诊断的示例。

阿里云文档 2024-09-06

通过Spark SQL读DLF管理的数据

数据湖构建 DLF(Data Lake Formation)提供了统一的元数据管理、统一的权限与安全管理、便捷的数据入湖能力以及一键式数据探索能力,您可以在云原生数据仓库 AnalyticDB MySQL 版中通过Spark SQL访问DLF中的元数据。

问答 2024-07-23 来自:开发者社区

MRACC-Spark的SQL引擎优化主要体现在哪些方面?

MRACC-Spark的SQL引擎优化主要体现在哪些方面?

文章 2023-12-25 来自:开发者社区

Note_Spark_Day08:Spark SQL(Dataset是什么、外部数据源、UDF定义和分布式SQL引擎)

Spark Day08:Spark SQL01-[了解]-昨日课程内容回顾上次课程主要讲解3个方面内容:SparkSQL模块概述、DataFrame数据集及综合案例分析。1、SparkSQL 模块概述 - 发展史【前世今生】 Shark -> SparkSQL(1.0) -> DataFrame(1.3) -> Dataset(1.6) -> Dataset/...

Note_Spark_Day08:Spark SQL(Dataset是什么、外部数据源、UDF定义和分布式SQL引擎)
文章 2023-09-17 来自:开发者社区

大数据Spark分布式SQL引擎

1 Spark SQL CLI回顾一下,如何使用Hive进行数据分析的,提供哪些方式交互分析???方式一:交互式命令行(CLI)1.bin/hive,编写SQL语句及DDL语句方式二:启动服务HiveServer2(Hive ThriftServer2)1.将Hive当做一个服务启动(类似MySQL数据库,启动一个服务),端口为100002.1)、交互式命令行,bin/beeline,CDH 版....

大数据Spark分布式SQL引擎
问答 2022-06-13 来自:开发者社区

Spark SQL引擎支持了window topn排序有哪些新增功能?

Spark SQL引擎支持了window topn排序有哪些新增功能?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注