文章 2017-02-28 来自:开发者社区

【Hadoop Summit Tokyo 2016】领英:4亿会员的数据赋能之旅

本讲义出自Rafael Coss在Hadoop Summit Tokyo 2016上的演讲,主要介绍了领英的数据赋能之旅,从产品研发的整个生命周期出发分享了数据驱动对于领英的意义,并分享了领英在面对大数据处理分析时遇到的挑战以及解决方案和所使用到工具。

文章 2017-02-28 来自:开发者社区

【Hadoop Summit Tokyo 2016】使用Apache Ranger和Apache Atlas进行数据治理

本讲义出自Madhan Neethiraj在Hadoop Summit Tokyo 2016上的演讲,主要分享了如何使用Apache Ranger和Apache Atlas保障数据安全并进行数据治理,首先分享了Apache Ranger的概览、授权策略、行过滤和列标记策略以及审计日记等相关内容,之后分享了Apache Atlas的概览的相关内容。

文章 2017-02-27 来自:开发者社区

【Hadoop Summit Tokyo 2016】使用Hadoop来构建实时和批数据的数据质量服务

本讲义出自Alex Lv与Amber Vaidya在Hadoop Summit Tokyo 2016上的演讲,主要分享了构建于Spark和Hadoop上的开源数据质量平台Griffin,Griffin可以用于处理批量数据、实时数据和非结构化的数据,并且构建了统一的过程来检测无效或者不准确等DQ问题,讲义中介绍了eBayGriffin的技术架构、以及用例等。

文章 2017-02-27 来自:开发者社区

【Hadoop Summit Tokyo 2016】在Apache Hadoop上保护企业数据

本讲义出自Owen O’Malley在Hadoop Summit Tokyo 2016上的演讲,主要分享了面对企业的数据安全和威胁问题,应该如何面对并且最小化攻击面,并且分享了如何保证Hive安全,列举了多种企业需要面对的数据安全威胁,并且分享了如何使用Apache Hadoop上保护企业数据安全。

文章 2017-02-27 来自:开发者社区

【Hadoop Summit Tokyo 2016】使Apache Zeppelin与Spark赋能企业数据科学

本讲义出自Bikas Saha在Hadoop Summit Tokyo 2016上的演讲,主要分享了如何使得数据科学在企业中变得容易实现以及目前企业中实现数据科学所面临的的挑战,并分享了在企业中如何使用Apache Zeppelin以及企业中数据科学的未来的发展规划。

文章 2017-02-27 来自:开发者社区

【Hadoop Summit Tokyo 2016】使用基于Lambda架构的Spark的近实时的网络异常检测和流量分析

本讲义出自Pankaj Rastogi与Debasish Das在Hadoop Summit Tokyo 2016上的演讲,主要分享了网络数据相关知识、网络异常DDoS攻击以及使用基于Lambda架构的Spark的近实时的网络异常检测和流量分析的架构设计,并分享了Trapezium的相关概念。

文章 2017-02-27 来自:开发者社区

【Hadoop Summit Tokyo 2016】Apache Phoenix与HBase:HBase之上SQL的过去,现在和未来

本讲义出自Enis Soztutar与Ankit Singhal在Hadoop Summit Tokyo 2016上的演讲,在他们的演讲中按照HBase之上SQL的过去,现在和未来进行划分进行了分别的讲解,对于“过去”部分讲义中分享了Phoenix的基础、架构和目前具有的特点,在“现在”部分讲义中分享了Phoenix最新的版本以及Phoenix查询服务器,而在未来部分则分享了Calcite的集成....

文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】将HDFS演进成广义分布式存储子系统

本讲义出自Sanjay Radia与Jitendra Pandey在Hadoop Summit Tokyo 2016上的演讲,主要分享了HDFS的相关概念,分享了HDFS从过去的演进过程以及在未来的发展方向,在讲义中介绍了目前值得关注的问题:文件和存储块的扩展性问题,并且分享了存储容器对于存储层的泛化。

文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】上云还是回到服务器:混合分析一瞥

本讲义出自Keith Manthey在Hadoop Summit Tokyo 2016上的演讲,主要分享了关于混合数据分析的两种架构的迁移,对于从服务器迁移到云端和从云端迁回到服务器进行了分析介绍,并且对于数据湖泊的概念进行了介绍。

文章 2017-02-26 来自:开发者社区

【Hadoop Summit Tokyo 2016】Hivemall: Apache Hive/Spark/Pig 的可扩展机器学习库

本讲义出自 Makoto YUI与NTT Takashi Yamamuro在Hadoop Summit Tokyo 2016上的演讲,主要介绍了Hivemall的相关知识以及Hivemall在Spark上的应用,Hivemall是可以用于Apache Hive/Spark/Pig 的可扩展机器学习库。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注