文章 2017-03-01 来自:开发者社区

【Hadoop Summit Tokyo 2016】以Apache Storm为例增强可靠性的流计算

本讲义出自Frank Zhao、Fenghao Zhang与 Yusong Lv在Hadoop Summit Tokyo 2016上的演讲,主要介绍了分布式流系统的相关概念,可靠性处理、Apache Storm的解决方案以及面对的挑战、新提出的方法以及 Apache Storm的原型和基准。

文章 2017-03-01 来自:开发者社区

【Hadoop Summit Tokyo 2016】服务大众的Hadoop

本讲义出自Amandeep Modgil与David Hamilton在Hadoop Summit Tokyo 2016上的演讲,主要分享了数据湖泊的起源问题、数据的安全性问题、数据治理、修改管理以及企业内的Hadoop工作等相关内容。

文章 2017-03-01 来自:开发者社区

【Hadoop Summit Tokyo 2016】文件格式的基准——Avro, JSON, ORC & Parquet

本讲义出自Owen O’Malley在Hadoop Summit Tokyo 2016上的演讲,主要分享了Avro, JSON, ORC & Parquet这些文件基本格式的相关内容,介绍了文件格式如何发挥不同的作用以及他们如何才能更好地发挥作用以及这些文件数据格式的各自的优点,还分享了如何使用真实的、多样化的数据集,并介绍了过度依赖类似的数据导致的弱点以及开放和审查基准。

文章 2017-03-01 来自:开发者社区

【Hadoop Summit Tokyo 2016】一个持续部署的Hadoop数据分析平台

本讲义出自Graham Gear在Hadoop Summit Tokyo 2016上的演讲,主要分享了数据工程开发管道的相关内容并介绍了持续部署的Hadoop数据分析平台Cloudera。

文章 2017-03-01 来自:开发者社区

【Hadoop Summit Tokyo 2016】现代化企业级数据仓库:数据湖泊

本讲义出自CHARLES SEVIOR在Hadoop Summit Tokyo 2016上的演讲,主要分享了面对企业级数据仓库向着数据量剧增、实时处理数据的需求增加以及数据分析的需求不断涌现的情况,如何定制个性化以及增强的现代化企业级数据仓库服务成为了一项巨大的挑战,而面对这样的挑战使用数据湖泊技术成为了一种新的解决方案。

文章 2017-03-01 来自:开发者社区

【Hadoop Summit Tokyo 2016】使用Amaterasu项目进行数据操作

本讲义出自Yaniv Rodenski与Karel Alfonso在Hadoop Summit Tokyo 2016上的演讲,主要分享了数据管道的相关知识以及其主要作用,并且分享了数据管道建造者的原型、数据操作以及协作等相关内容,还分享了大数据应用的持续集成的案例,最后还介绍了Apache下的开源分布式资源管理框架Mesos的相关内容。

文章 2017-03-01 来自:开发者社区

【Hadoop Summit Tokyo 2016】企业数据分类和治理

本讲义出自Shwetha Shivalingamurthy与Suma Shivaprasad在Hadoop Summit Tokyo 2016上的演讲,主要分享了企业数据分类和治理的案例并且深入地讲解了大数据治理的相关内容,并介绍了Atlas的概览和架构设计以及其特性和发展路线。

文章 2017-03-01 来自:开发者社区

【Hadoop Summit Tokyo 2016】云上SQL-on-Hadoop的状态

本讲义出自Nicolas Poggi在Hadoop Summit Tokyo 2016上的演讲,在演讲中首先介绍了BSC 与ALOJA以及PaaS服务概览,之后介绍了SQL基准以及PaaS服务的演进变化,最后分享了从云上的SQL-on-Hadoop中获取的经验。

文章 2017-03-01 来自:开发者社区

【Hadoop Summit Tokyo 2016】构建多租户平台

本讲义出自Grant Priestley在Hadoop Summit Tokyo 2016上的演讲,主要对于多租户平台Hurdles进行了详细介绍,并介绍了多租户的概念和定义以及构建多租户平台的架构设计和技术策略,最后还分享了在构建多租户平台的过程中需要注意的事项。

文章 2017-03-01 来自:开发者社区

【Hadoop Summit Tokyo 2016】对于非文本的自然语言处理结构化数据调查

本讲义出自Casey Stella在Hadoop Summit Tokyo 2016上的演讲,主要分享了在数据科学中经常会遇到的一些挑战,比如数据科学家往往在所需要研究的领域经验不足、获取这方面的经验将会非常耗费时间并且极具挑战性、非监督机器学习技术非常有用,但是复杂的数据关系却难以理解等,还分享了文本深度表示模型Word2Vec,并且对于示例进行了演示。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注