阿里云文档 2025-03-26

连接SparkSQL报数据源连通性异常,请检查参数是否正确错误信息AE0610260030:Accessing illegal hostname or ip

问题描述Quick BI的数据源连接Spark SQL数据库数据源时报错:数据源连通性异常,请检查参数是否正确错误信息:"AE0610260030:Accessing illegal hostname or ip."。数据源连通性异常,请检查参数是否正确错误信息:"AE0610260030:Acce...

问答 2022-12-13 来自:开发者社区

Dataworks如何配置Spark节点中的时间参数

Dataworks如何配置Spark节点中的时间参数

文章 2022-08-22 来自:开发者社区

Spark - Task 与 Partition 一一对应与参数详解

 一.引言使用 spark 读取 parquet 文件,共有 M 个 parquet 文件,于是启动了 P Executor x Q Cores 进行如下 WordCount 代码测试,其中 P x Q = M 即 Core 数目与 parquet 文件数一一对应:编辑 其中每个 row 的 47 列对应的 parquet 文件名样例如下:/usr/hadoop/part-01005-....

Spark - Task 与 Partition 一一对应与参数详解
文章 2022-08-20 来自:开发者社区

docker下的spark集群,调整参数榨干硬件

欢迎访问我的GitHub这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos本篇概览本文是《docker下,极速搭建spark集群(含hdfs集群)》的续篇,前文将spark集群搭建成功并进行了简单的验证,但是存在以下几个小问题:spark只有一个work节点,只适合处理小数据量的任务,遇到大量数据的任务要消耗更多时间;hdfs的....

docker下的spark集群,调整参数榨干硬件
文章 2022-06-13 来自:开发者社区

spark-submit 参数设置

正文在使用spark时,根据集群资源情况和任务数据量等,合理设置参数,包括但不限于以下:参数说明masteryarn  E-MapReduce 使用 Yarn 的模式yarn-client:等同于 –-master yarn —deploy-mode client, 此时不需要指定deploy-mode。 yarn-cluster:等同于 –-master yarn —dep....

文章 2022-04-02 来自:开发者社区

spark job运行参数优化

一、问题       使用spark join两张表(5000w*500w)总是出错,报的异常显示是在shuffle阶段。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 14/11/27 12:05:49 ERROR storage.DiskBlockObjectWriter: Uncaught exce...

文章 2022-02-17 来自:开发者社区

Hive引擎Spark优化配置参数2

扩展spark driver 动态资源分配 在 Facebook,Spark 集群启用了动态资源分配(Dynamic Executor Allocation),以便更好的使用集群资源,而且在 Facebook 内部,Spark 是运行在多租户的集群上,所以这个也是非常合适的。比如典型的配置如下: spark.dynamicAllocation.enabled = truespark.dynami....

 Hive引擎Spark优化配置参数2
文章 2022-02-17 来自:开发者社区

Hive引擎Spark优化配置参数1

Hive是大数据领域常用的组件之一,主要是大数据离线数仓的运算,关于Hive的性能调优在日常工作和面试中是经常涉及的的一个点,因此掌握一些Hive调优是必不可少的一项技能。影响Hive效率的主要有数据倾斜、数据冗余、job的IO以及不同底层引擎配置情况和Hive本身参数和HiveSQL的执行等因素。本文主要描述在底层引擎为Spark时,经常会用到的、常见的配置参数。 资源参数优化 所谓的Spar....

Hive引擎Spark优化配置参数1
文章 2022-02-17 来自:开发者社区

Spark参数配置说明

1  修改$SPARK_HOME/conf目录下的spark-defaults.conf文件 添加以下配置项 spark.sql.hive.convertMetastoreParquet       false hive.exec.compress.output     false 如果s...

文章 2022-02-17 来自:开发者社区

Spark配置参数调优

1.配置多个executor        在项目中,由于数据量为几百万甚至千万级别,如果一个executor装载的对象过多,会导致GC很慢。项目中,我们使一个worker节点执行app时启动多个executor,从而加大并发度,解决full GC慢的问题。同时,由于启动了多个exeucute,在内存与核数不变的情况下,需要调整分配给每个...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注