问答 2020-02-14 来自:开发者社区

spark 和 mapreduce 的对比

spark 和 mapreduce 的对比

问答 2020-02-14 来自:开发者社区

spark on yarn 和 mapreduce 中 yarn 有什么区别

spark on yarn 和 mapreduce 中 yarn 有什么区别

问答 2019-10-29 来自:开发者社区

Hadoop中,Mapreduce操作的mapper和reducer阶段相当于spark中的哪些算子

Hadoop中,Mapreduce操作的mapper和reducer阶段相当于spark中的哪几个算子?

问答 2019-10-25 来自:开发者社区

Mapreduce和Spark的都是并行计算,那么他们有什么相同和区别

Mapreduce和Spark的都是并行计算,那么他们有什么相同和区别

问答 2019-10-25 来自:开发者社区

Spark为什么比mapreduce快?

Spark为什么比mapreduce快?

问答 2019-04-26 来自:开发者社区

Spark Streaming 作业已经结束,但是 E-MapReduce 控制台显示作业还处于“运行中”状态

Spark Streaming 作业已经结束,但是 E-MapReduce 控制台显示作业还处于“运行中”状态

问答 2018-12-13 来自:开发者社区

什么是Mapreduce相当于Spark中的top()函数?

我正在尝试为Mapreduce实现找到spark中的等效解决方案top()和take()函数。我想提取前k个值,而不保存整个键,值对。

文章 2017-11-09 来自:开发者社区

【问题】spark运行python写的mapreduce任务,hadoop平台报错,java.net.ConnectException: 连接超时

问题: 用spark-submit以yarn-client方式提交任务,在集群的某些节点上的任务出现连接超时的错误,排查过各种情况后,确定在防火墙配置上出现问题。 原因: 我猜测是python程序启动后,作为Server,hadoop中资源调度是以java程序作为Client端访问, Python启动的Server端需要接受localhost的client访问。 当你从一台linux主机向自身发....

文章 2017-11-05 来自:开发者社区

Spark Tachyon实战应用(配置启动环境、运行spark和运行mapreduce)

Tachyon实战应用 配置及启动环境 修改spark-env.sh 启动HDFS 启动Tachyon Tachyon上运行Spark 添加core-site.xml 启动Spark集群 读取文件并保存 Tachyon运行MapReduce 修改core-site.xml 启动YARN 运行MapReduce例子  ...

Spark Tachyon实战应用(配置启动环境、运行spark和运行mapreduce)
文章 2017-11-03 来自:开发者社区

Spark 概念学习系列之Spark相比Hadoop MapReduce的特点(二)

Spark相比Hadoop MapReduce的特点      (1)中间结果输出      基于MapReduce的计算引擎通常会将中间结果输出到磁盘上,进行存储和容错。 出于任务管道承接的考虑,当一些查询翻译到MapReduce任务时,往往会产生多个Stage,而这些串联的Stage又依赖于底层文件系统(如HDFS)来存储每...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注