文章 2017-03-01 来自:开发者社区

【Hadoop Summit Tokyo 2016】服务大众的Hadoop

本讲义出自Amandeep Modgil与David Hamilton在Hadoop Summit Tokyo 2016上的演讲,主要分享了数据湖泊的起源问题、数据的安全性问题、数据治理、修改管理以及企业内的Hadoop工作等相关内容。

文章 2017-02-27 来自:开发者社区

【Hadoop Summit Tokyo 2016】使用Hadoop来构建实时和批数据的数据质量服务

本讲义出自Alex Lv与Amber Vaidya在Hadoop Summit Tokyo 2016上的演讲,主要分享了构建于Spark和Hadoop上的开源数据质量平台Griffin,Griffin可以用于处理批量数据、实时数据和非结构化的数据,并且构建了统一的过程来检测无效或者不准确等DQ问题,讲义中介绍了eBayGriffin的技术架构、以及用例等。

问答 2017-02-03 来自:开发者社区

在阿里云上自己搭建hadoop/hive的官方版本的集群,可不可以使用oss的服务

我在阿里云上搭建了,hadoop/hive官网开源版本的集群,不是使用阿里云提供的E-MapReduce版本,不知道能不能在官方版本的hive中使用阿里云oss作为数据源?如果可以,能否提供一下示例代码。

文章 2016-09-14 来自:开发者社区

针对Hadoop YARN 的REST API web服务介绍

打开微信扫一扫,关注微信公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt   博主微博:http://weibo.com/234654758 (欢迎互撩) Github:https://github.com/thinkgamer ======================================...

文章 2016-04-21 来自:开发者社区

Hadoop Common源码分析之服务Service

        Service是定义Hadoop中服务生命周期的一个接口。Service内部定义了服务的状态及生命周期,在服务被构造后,其一个生命周期内的状态为NOTINITED未初始化--INITED已初始化--已启动STARTED--已停止STOPPED,而这一生命周期内服务状态的变化,是随着如下方法链的调用而变化的:init()--start...

问答 2015-05-01 来自:开发者社区

啥时候有hadoop服务啊

啥时候有hadoop服务啊 amazon早就有了

文章 2014-12-08 来自:开发者社区

发布Apache Hadoop 2.6.0——异构存储,长时间运行的服务与滚动升级支持

发布Apache Hadoop 2.6.0——异构存储,长时间运行的服务与滚动升级支持 我很高兴地宣布,在Apache的Hadoop社区已经发布的Apache Hadoop的2.6.0:http://markmail.org/message/gv75qf3orlimn6kt! 特别是,我们很高兴在此版本中相关的三个主要片:异构存储在HDFS使用SSD和内存层,支持长时间运行在YARN服务和滚动升....

文章 2014-03-24 来自:开发者社区

hadoop整体结构图及服务组件详解

hadoop服务组件简单解释 1、core  分布式系统和通用IO组件和接口(序列化、java远程调用等等服务) 2、avro  支持跨语言过程调用,持久数据存储的数据序列化系统 3、MapReduce  构建在廉价的pc机器上分布式数据处理模型和运行环境 4、hdfs  构建廉价的pc机器上分布式文件系统 5、pig  处理海量数据集的数据流语言...

问答 2012-11-07 来自:开发者社区

什么时候会有hadoop等分布式计算平台服务?

hadoop等这些分布式计算平台,个人是没有经济实力搭建起来的;不知道阿里云什么时候会提供有这方面的服务?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注