文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】Apache NiFi 1.0概论

本讲义出自Koji Kawamura与Arti Wadhwani在Hadoop Summit Tokyo 2016上的演讲,主要介绍了Apache NiFi的相关内容,并分享了Apache NiFi 1.0版本的增强以及目前 NiFi的边界,以及与NiFi相关的问题和未来展望。

文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】中型组织的数据基础设施架构:收集、存储和分析的技巧

本讲义出自 Egor Pakhomov在Hadoop Summit Tokyo 2016上的演讲,主要分享了数据收集、存储和分析的技巧,介绍了为什么SQL如此的重要以及如何在Hadoop中使用SQL,以及在数据存储过程中如何此案呢过做到使得存储的数据能够既能易于查询又能容易地进行改变,以及如何使用BI工具聚合数据。

文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】Rakuten是如何解决由于大规模多租户Hadoop集群造成的迷之问题的

本讲义出自Tomomichi Hirano在Hadoop Summit Tokyo 2016上的演讲,主要分享了Rakuten公司遇到的大规模多租户Hadoop集群造成的迷之问题:从来不结束任务、数据结点冻结、命名结点冻结、命名节点重新启动后出现高负载以及在解决上述问题中获取的经验教训,并且分享了Rakuten的服务器配置和管理经验。

文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】使用Apache Ambari简化Hadoop DevOps

本讲义出自 Jayush Luniya在Hadoop Summit Tokyo 2016上的演讲,主要介绍了Apache Ambari,Apache Ambari是用于创建、管理、监视 整个Hadoop生态圈软件的集群的分布式架构的软件,Ambari 可以让 Hadoop 以及相关的大数据软件更容易使用,本讲义就介绍了如何使用Apache Ambari简化Hadoop项目的开发和运维。

文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】Apache Hive在完全支持SQL规范上取的主要进步

本讲义出自Pengcheng Xiong与Ashutosh Chauhan在Hadoop Summit Tokyo 2016上的演讲,主要分享了SQL 2011规范的关键字以及保留关键字、主键和外键以及集合操作等,并分享了当前Apache Hive在完全支持SQL规范上取的主要进步。

文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】为什么我的Hadoop集群运行这么慢?

本讲义出自Bikas Saha在Hadoop Summit Tokyo 2016上的演讲,主要分享了对于Hadoop集群的性能度量与监控、日志记录、以及跟踪和分析等的相关方法和使用到的HBase、HDFS、YARN等相关的开源技术。

文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】基于容器规格的Apache Hadoop/Spark集群框架

本讲义出自Akiyoshi SUGIKI与Phyo Thandar Thant在Hadoop Summit Tokyo 2016上的演讲,主要分享了Hokkaido大学的学术云的发展历史以及对于大数据分析的支撑情况,并介绍了基于容器规格的Apache Hadoop集群框架,以及对于Hadoop的多目标优化方案。

文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】东日本可口可乐公司Hadoop之旅,从一滴到一瓶

本讲义出自Damien Contreras在Hadoop Summit Tokyo 2016上的演讲,主要分享了东日本可口可乐公司的Hadoop技术应用的经验、Hadoop实际项目以及Hadoop在以可口可乐为代表的的制造业的应用和未来东日本可口可乐公司的Hadoop技术发展方向。

文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】雅虎日本的大规模Hadoop集群网络

本讲义出自Kai Fukazawa在Hadoop Summit Tokyo 2016上的演讲,主要分享了与Hadoop相关的网络技术,并分享了雅虎日本的网络技术转型发展之路和网络相关的问题以及解决方案,介绍了雅虎日本IP CLOS的网络架构设计以及遇到的挑战以及在未来雅虎日本在网络技术方面的发展计划。

文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】利用电力公司智能电表数据比较Spark SQL与Hive

本讲义出自Yusuke Furuyama与Yang Xie在Hadoop Summit Tokyo 2016上的演讲,主要分享了对于电力公司智能电表数据的数据分析案例,并分享了利用MapReduce与Spark 1.6进行计算的性能比较情况,并对于Spark 2.0的进化情况进行了分享。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注