文章 2017-07-24 来自:开发者社区

在E-MapReduce集群内运行Spark GraphX作业

Spark GraphX是一个比较流行的图计算框架,如果你使用了阿里云的E-MapReduce服务,可以很方便的运行图计算的作业。 下面以PageRank为例,看看如何运行GraphX作业。这个例子来自Spark官方的example(examples/src/main/scala/org/apache/spark/examples/graphx/PageRankExample.scala),直接....

文章 2017-07-03 来自:开发者社区

《Spark与Hadoop大数据分析》一一2.4 安装 Hadoop 和 Spark 集群

本节书摘来自华章计算机《Spark与Hadoop大数据分析》一书中的第2章,第2.4节,作者:文卡特·安卡姆(Venkat Ankam) 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.4 安装 Hadoop 和 Spark 集群 在安装 Hadoop和Spark之前,让我们来了解一下 Hadoop和Spark的版本。在 Cloudera、Hortonworks和MapR这所有三种流....

文章 2017-07-03 来自:开发者社区

Spark 0.8 集群(CentOS6.4)-简单统计测试

 环境:CentOS 6.4, hadoop-2.0.0-cdh4.2.0, JDK 1.6, spark-0.8.0-incubating-bin-cdh4.tar.gz,Scala 2.9.3   1. 安装、部署集群环境   参考前章《安装Spark 0.8集群(CentOS6.4) - 大数据之内存计算》   2. 测试描述   使用在线测试数据生工具,动态生成如下json数据(...

Spark 0.8 集群(CentOS6.4)-简单统计测试
文章 2017-07-03 来自:开发者社区

《Spark大数据处理:技术、应用与性能优化》——2.2 Spark集群初试

本节书摘来自华章计算机《Spark大数据处理:技术、应用与性能优化》一书中的第2章,第2.2节,作者:高彦杰 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2 Spark集群初试 假设已经按照上述步骤配置完成Spark集群,可以通过两种方式运行Spark中的样例。下面以Spark项目中的SparkPi为例,可以用以下方式执行样例。1)以./run-example的方式执行用户可以按....

文章 2017-07-03 来自:开发者社区

《Spark大数据处理:技术、应用与性能优化》——第2章 Spark集群的安装与部署2.1 Spark的安装与部署

本节书摘来自华章计算机《Spark大数据处理:技术、应用与性能优化》一书中的第2章,第2.1节,作者:高彦杰 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第2章 Spark集群的安装与部署 Spark的安装简便,用户可以在官网上下载到最新的软件包。Spark最早是为了在Linux平台上使用而开发的,在生产环境中也是部署在Linux平台上,但是Spark在UNIX、Windwos和Ma....

文章 2017-05-19 来自:开发者社区

《Spark官方文档》集群模式概览

集群模式概览 本文简要描述了Spark在集群中各个组件如何运行。想了解如何在集群中启动Spark应用,请参考application submission guide 。 组件 Spark应用在集群上运行时,包括了多个独立的进程,这些进程之间通过你的主程序(也叫作驱动器,即:driver)中的SparkContext对象来进行协调。 特别要指出的是,SparkContext能与多种集群管理...

《Spark官方文档》集群模式概览
文章 2017-05-02 来自:开发者社区

《循序渐进学Spark》一1.3 Spark 集群试运行

本节书摘来自华章出版社《循序渐进学Spark》一书中的第1章,第1.3节,作者   小象学院 杨 磊 更多章节内容可以访问云栖社区“华章计算机”公众号查看。  1.3 Spark 集群试运行 下面试运行Spark。 1)在Master主机上,分别启动Hadoop与Spark。 cd /usr/local/hadoop/sbin/ ./start-all.sh cd /usr/l...

文章 2017-05-02 来自:开发者社区

《Spark Cookbook 中文版》一1.7 在集群上使用YARN部署

本节书摘来异步社区《Spark Cookbook 中文版》一书中的第1章,第1.7节,作者: 【印度】Rishi Yadav(亚达夫)译者: 顾星竹 , 刘见康 责编: 胡俊英,更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.7 在集群上使用YARN部署 另一种资源协调者(YARN)是基于HDFS这个Hadoop存储层的Hadoop计算框架。 YARN遵循主从架构。主守护进程被称为资源....

文章 2017-05-02 来自:开发者社区

《循序渐进学Spark》一1.2 在Linux集群上部署Spark

本节书摘来自华章出版社《循序渐进学Spark》一书中的第1章,第 节,作者   小象学院 杨 磊 更多章节内容可以访问云栖社区“华章计算机”公众号查看。  1.2 在Linux集群上部署Spark Spark安装部署比较简单,用户可以登录其官方网站(http://spark.apache.org/downloads.html)下载Spark最新版本或历史版本,也可以查阅Spar...

文章 2017-05-02 来自:开发者社区

《Spark Cookbook 中文版》一1.6 在集群上使用Mesos部署Spark

本节书摘来异步社区《Spark Cookbook 中文版》一书中的第1章,第1.6节,作者: 【印度】Rishi Yadav(亚达夫)译者: 顾星竹 , 刘见康 责编: 胡俊英,更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.6 在集群上使用Mesos部署Spark Mesos正慢慢崛起为跨数据中心管理所有计算资源的数据中心管理系统。Mesos可以运行在任意一台Linux操作系统的机器....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注