文章 2022-02-15 来自:开发者社区

【Hadoop Summit Tokyo 2016】使Apache Zeppelin与Spark赋能企业数据科学

本讲义出自Bikas Saha在Hadoop Summit Tokyo 2016上的演讲,主要分享了如何使得数据科学在企业中变得容易实现以及目前企业中实现数据科学所面临的的挑战,并分享了在企业中如何使用Apache Zeppelin以及企业中数据科学的未来的发展规划。

文章 2022-02-15 来自:开发者社区

【Hadoop Summit Tokyo 2016】Apache Phoenix与HBase:HBase之上SQL的过去,现在和未来

本讲义出自Enis Soztutar与Ankit Singhal在Hadoop Summit Tokyo 2016上的演讲,在他们的演讲中按照HBase之上SQL的过去,现在和未来进行划分进行了分别的讲解,对于“过去”部分讲义中分享了Phoenix的基础、架构和目前具有的特点,在“现在”部分讲义中分享了Phoenix最新的版本以及Phoenix查询服务器,而在未来部分则分享了Calcite的集成....

文章 2022-02-15 来自:开发者社区

【Hadoop Summit Tokyo 2016】Hivemall: Apache Hive/Spark/Pig 的可扩展机器学习库

本讲义出自 Makoto YUI与NTT Takashi Yamamuro在Hadoop Summit Tokyo 2016上的演讲,主要介绍了Hivemall的相关知识以及Hivemall在Spark上的应用,Hivemall是可以用于Apache Hive/Spark/Pig 的可扩展机器学习库。

文章 2022-02-15 来自:开发者社区

【Hadoop Summit Tokyo 2016】Apache NiFi 1.0概论

本讲义出自Koji Kawamura与Arti Wadhwani在Hadoop Summit Tokyo 2016上的演讲,主要介绍了Apache NiFi的相关内容,并分享了Apache NiFi 1.0版本的增强以及目前 NiFi的边界,以及与NiFi相关的问题和未来展望。

文章 2022-02-15 来自:开发者社区

【Hadoop Summit Tokyo 2016】中型组织的数据基础设施架构:收集、存储和分析的技巧

本讲义出自 Egor Pakhomov在Hadoop Summit Tokyo 2016上的演讲,主要分享了数据收集、存储和分析的技巧,介绍了为什么SQL如此的重要以及如何在Hadoop中使用SQL,以及在数据存储过程中如何此案呢过做到使得存储的数据能够既能易于查询又能容易地进行改变,以及如何使用BI工具聚合数据。

文章 2022-02-15 来自:开发者社区

【Hadoop Summit Tokyo 2016】Apache Hive在完全支持SQL规范上取的主要进步

本讲义出自Pengcheng Xiong与Ashutosh Chauhan在Hadoop Summit Tokyo 2016上的演讲,主要分享了SQL 2011规范的关键字以及保留关键字、主键和外键以及集合操作等,并分享了当前Apache Hive在完全支持SQL规范上取的主要进步。

文章 2022-02-15 来自:开发者社区

【Hadoop Summit Tokyo 2016】基于容器规格的Apache Hadoop/Spark集群框架

本讲义出自Akiyoshi SUGIKI与Phyo Thandar Thant在Hadoop Summit Tokyo 2016上的演讲,主要分享了Hokkaido大学的学术云的发展历史以及对于大数据分析的支撑情况,并介绍了基于容器规格的Apache Hadoop集群框架,以及对于Hadoop的多目标优化方案。

文章 2022-02-15 来自:开发者社区

【Hadoop Summit Tokyo 2016】利用电力公司智能电表数据比较Spark SQL与Hive

本讲义出自Yusuke Furuyama与Yang Xie在Hadoop Summit Tokyo 2016上的演讲,主要分享了对于电力公司智能电表数据的数据分析案例,并分享了利用MapReduce与Spark 1.6进行计算的性能比较情况,并对于Spark 2.0的进化情况进行了分享。

文章 2022-02-15 来自:开发者社区

【Hadoop Summit Tokyo 2016】Apache NiFi速成课

本讲义出自Rafael Coss在Hadoop Summit Tokyo 2016上的演讲,主要分享了与Apache NiFi相关的知识,Apache NiFi 是一个易于使用、功能强大而且可靠的数据处理和分发系统,Apache NiFi 是为数据流设计。它支持高度可配置的指示图的数据路由、转换和系统中介逻辑。讲义中还讲解了与数据流相关的基本概念,以及在数据流的使用中面临的挑战和困难。

文章 2017-03-02 来自:开发者社区

【Hadoop Summit Tokyo 2016】操纵云上基于Hadoop 集群的YARN

本讲义出自Abhishek Modi在Hadoop Summit Tokyo 2016上的演讲,主要介绍了Qubole的Hadoop技术、Qubole的架构设计、短生命周期的Hadoop集群的相关内容以及面对的挑战以及YARN的自动扩展和不断发展的HDFS技术。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注