问答 2018-12-21 来自:开发者社区

如何监控AWS EMR集群中托管的spark中的hive thrift服务器运行状况?

我们使用JDBC连接到我们的spark EMR集群上的hive thrift服务器。我们遇到了一些thrift服务器崩溃的瞬态问题,需要手动重启。我们想知道是否有任何[希望简单]的方式来监控服务器的健康状况?至少,我们希望在它发生故障时收到警报。拥有其他服务器运行状况指标也很不错。

文章 2018-09-15 来自:开发者社区

Hadoop和Spark集群搭建的大致流程

【Hadoop】 1.首先,准备好Hadoop安装包和JDK的安装与配置2.建立各个机器之间的ssh信任关系,即互信3.修改hadoop配置文件【core、hdfs、yarn、mapred】默认配置文件:core-default.xml、hdfs-default.xml、mapred-default.xml、yarn-default.xml特定配置文件:core-site.xml、hdfs-si....

文章 2018-08-07 来自:开发者社区

Spark在不同集群中的运行架构

        Spark注重建立良好的生态系统,它不仅支持多种外部文件存储系统,提供了多种多样的集群运行模式。部署在单台机器上时,既可以用本地(Local)模式运行,也可以使用伪分布式模式来运行;当以分布式集群部署的时候,可以根据自己集群的实际情况选择Standalone模式(Spark自带的模式)、YARN-Cli...

问答 2018-08-04 来自:开发者社区

表格存储批量插入数据本地测试可以,spark集群测试报错

根据阿里文档编写批量插入数据程序,本地local模式测试成功,spark集群测试失败,报错如下:java.lang.UnsupportedOperationException: This is supposed to be overridden by subclasses.at com.google.protobuf.GeneratedMessage.getUnknownFields(Gener....

问答 2018-07-13 来自:开发者社区

需要spark集群如何申请

想用pyspark对大数据进行机器学习的练习和分析,有没有现成的spark集群可以租用,还是需要自己从头搭建?

文章 2017-12-19 来自:开发者社区

hadoop+spark集群搭建

1.选取三台服务器(CentOS系统64位)   114.55.246.88 主节点   114.55.246.77 从节点   114.55.246.93 从节点      之后的操作如果是用普通用户操作的话也必须知道root用户的密码,因为有些操作是得用root用户操作。如果是用root用户操作的话就不存在以上问题。   我是用roo...

文章 2017-12-04 来自:开发者社区

《Spark快速大数据分析》—— 第七章 在集群上运行Spark

本文转自博客园xingoo的博客,原文链接:《Spark快速大数据分析》—— 第七章 在集群上运行Spark,如需转载请自行联系原博主。

问答 2017-11-30 来自:开发者社区

EMR集群spark出现Tez相关类找不到

Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/tez/dag/api/SessionNotRunning at org.apache.hadoop.hive.ql.session.SessionState.start(SessionState.java:529) at org.apache.spar...

文章 2017-11-29 来自:开发者社区

Spark Tachyon编译部署(含单机和集群模式安装)

Tachyon编译部署 编译Tachyon 单机部署Tachyon 集群模式部署Tachyon           1、Tachyon编译部署   Tachyon目前的最新发布版为0.7.1,其官方网址为http://tachyon-project.org/。Tachyon文件系统有3种部署方式:单机模式、集群模式和高可用集群模式,集群模式相比于高...

Spark Tachyon编译部署(含单机和集群模式安装)
文章 2017-11-28 来自:开发者社区

spark集群配置

mv /home/abc /home/abcd(修改目录名) (1)vi /usr/local/hadoop/etc/hadoop/core-site.xml <configuration>         <property>           &nb...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注