文章 2017-11-20 来自:开发者社区

Hadoop MapReduce编程 API入门系列之统计学生成绩版本2(十八)

 统计出每个年龄段的 男、女 学生的最高分     这里,为了空格符的差错,直接,我们有时候,像如下这样的来排数据。                                   代码 package zhouls...

Hadoop MapReduce编程 API入门系列之统计学生成绩版本2(十八)
文章 2017-11-20 来自:开发者社区

Hadoop MapReduce编程 API入门系列之Crime数据分析(二十五)(未完)

  一共12列,我们只需提取有用的列:第二列(犯罪类型)、第四列(一周的哪一天)、第五列(具体时间)和第七列(犯罪场所)。     思路分析         基于项目的需求,我们通过以下几步完成: 1、首先根据数据集,分别统计出不同犯罪类别在周时段内发生犯罪次数和不同区域在周时段内发生犯罪的次数。 ...

Hadoop MapReduce编程 API入门系列之Crime数据分析(二十五)(未完)
文章 2017-11-19 来自:开发者社区

Hadoop MapReduce编程 API入门系列之挖掘气象数据版本3(九)

                                          代码 package zhouls.bigdata.myMapReduce.weather; import...

Hadoop MapReduce编程 API入门系列之挖掘气象数据版本3(九)
文章 2017-11-14 来自:开发者社区

Hadoop MapReduce编程 API入门系列之查找相同字母组成的字谜(三)

  找出相同单词的所有单词。现在,是拿取部分数据集(如下)来完成本项目。     项目需求   一本英文书籍包含成千上万个单词或者短语,现在我们需要在大量的单词中,找出相同字母组成的所有anagrams(字谜)。   思路分析   基于以上需求,我们通过以下几步完成:     1、在 Map 阶段,对每个word(单词)按字母进行排序生成sorte...

Hadoop MapReduce编程 API入门系列之查找相同字母组成的字谜(三)
文章 2017-11-14 来自:开发者社区

Hadoop MapReduce编程 API入门系列之最短路径(十五)

    ====================================== = Iteration: 1 = Input path: out/shortestpath/input.txt = Output path: out/shortestpath/1 ====================================== 2016-12-12 16:37:0...

Hadoop MapReduce编程 API入门系列之最短路径(十五)
文章 2017-11-14 来自:开发者社区

Hadoop MapReduce编程 API入门系列之join(二十六)

      天气记录数据库       气象站数据库         气象站和天气记录合并之后的示意图如下所示。 011990-99999 SIHCCAJAVRI 195005150700 0 011990-99999 SIHCCAJAVRI 195005151200 22 011990-99999...

Hadoop MapReduce编程 API入门系列之join(二十六)
文章 2017-11-13 来自:开发者社区

Hadoop MapReduce编程 API入门系列之分区和合并(十四)

                        代码 1 package zhouls.bigdata.myMapReduce.Star; 2 3 4 import java.io.IOException; 5 import org.apache.hadoop.conf.Conf...

Hadoop MapReduce编程 API入门系列之分区和合并(十四)
文章 2017-11-13 来自:开发者社区

Hadoop MapReduce编程 API入门系列之网页流量版本1(二十一)

  对流量原始日志进行流量统计,将不同省份的用户统计结果输出到不同文件。                                               代码...

Hadoop MapReduce编程 API入门系列之网页流量版本1(二十一)
文章 2017-11-13 来自:开发者社区

Hadoop MapReduce编程 API入门系列之网页排序(二十八)

  Map output bytes=247 Map output materialized bytes=275 Input split bytes=139 Combine input records=0 Combine output records=0 Reduce input groups=4 Reduce shuffle bytes=275 Reduce input records...

Hadoop MapReduce编程 API入门系列之网页排序(二十八)
文章 2017-11-13 来自:开发者社区

Hadoop MapReduce编程 API入门系列之小文件合并(二十九)

  Hadoop 自身提供了几种机制来解决相关的问题,包括HAR,SequeueFile和CombineFileInputFormat。       Hadoop 自身提供的几种小文件合并机制 Hadoop HAR         将众多小文件打包成一个大文件进行存储,...

Hadoop MapReduce编程 API入门系列之小文件合并(二十九)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云E-MapReduce

阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

+关注