文章 2022-06-09 来自:开发者社区

【Spark】(五)Spark Transformation(转换算子) 和 Action(执行算子)1

文章目录一、Transformation 和 Action1、转换操作2、行动操作二、map、flatMap、mapParations、mapPartitionsWithIndex2.1 map2.2 flatMap3.3 mapPartitions3.4 mapPartitionsWithIndex三、reduce、reduceByKey3.1 reduce3.2 reduceByKey四、u....

【Spark】(五)Spark Transformation(转换算子) 和 Action(执行算子)1
文章 2022-05-29 来自:开发者社区

Spark SQL中掌控sql语句的执行 - 了解你的查询计划

背景自spark 2.x 的sql以及申明行DataFrame APi以来,在spark查询数据越来越方便。仅仅用几行代码就能表达出复杂的查询逻辑以及实现复杂的操作。 这个api最大的优势在于用户不需要考虑太多的执行情况,自动有优化器优化出最有效率的执行方式去执行此次查询。而且有效的查询语句执行不仅是因为能够节约资源,而且能够减少终端用户等待结果的时间。Spark SQL 优化器实际上是很成熟的....

Spark SQL中掌控sql语句的执行 - 了解你的查询计划
文章 2022-05-24 来自:开发者社区

用spark shell执行操作hive

一、安装:(注意版本兼容)hadoop2.7.2,hive1.3,spark1.6二、相关配置:hive配置hive-site.xml:把hive-site.xml拷贝至spark的conf目录下并添加:<property> <name>hive.metastore.uris</name> <value>thrift://192.168.234.1....

文章 2022-05-24 来自:开发者社区

用spark sql执行操作hive

一、安装:(注意版本兼容)hadoop2.7.2,hive1.3,spark1.6二、相关配置:hive配置hive-site.xml把hive-site.xml拷贝至spark的conf目录下并添加:【如果不能运行,这配置去掉重试】<property> <name>hive.metastore.uris</name> <value>thrift:....

问答 2021-12-11 来自:开发者社区

Spark程序执行,有时候默认为什么会产生很多task,怎么修改默认task执行个数?

Spark程序执行,有时候默认为什么会产生很多task,怎么修改默认task执行个数?

问答 2021-12-10 来自:开发者社区

Spark中获取任务执行结果的两种类型是什么?

Spark中获取任务执行结果的两种类型是什么?

问答 2021-12-10 来自:开发者社区

Spark中获取任务执行结果DAGScheduler是什么?

Spark中获取任务执行结果DAGScheduler是什么?

问答 2021-12-07 来自:开发者社区

Spark Application在没有获得足够的资源,job就开始执行会产生什么问题?

Spark Application在没有获得足够的资源,job就开始执行会产生什么问题?

问答 2021-12-06 来自:开发者社区

如何在spark-shell命令行执行spark hql

如何在spark-shell命令行执行spark hql

问答 2021-12-06 来自:开发者社区

spark持久化后的执行原理是什么?

spark持久化后的执行原理是什么?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注