文章 2023-12-22 来自:开发者社区

大数据面试题百日更新_Hadoop专题(Day10)

12. 请说下 MR 中 shuffle 阶段13. shuffle 阶段的数据压缩机制了解吗

大数据面试题百日更新_Hadoop专题(Day10)
文章 2023-12-22 来自:开发者社区

大数据面试题百日更新_Hadoop专题(Day09)

10. 请说下 MR 中 Map Task 的工作机制简单概述:inputFile 通过 split 被切割为多个 split 文件,通过 Record 按行读取内容给map(自己写的处理逻辑的方法),数据被 map 处理完之后交给 OutputCollect 收集器,对其结果 key 进行分区(默认使用的 hashPartitioner),然后写入 buffer,每个 map task 都有一....

文章 2023-12-22 来自:开发者社区

大数据面试题百日更新_Hadoop专题(Day08)

请说下 HDFS 的组织架构

大数据面试题百日更新_Hadoop专题(Day08)
文章 2023-12-22 来自:开发者社区

大数据面试题百日更新_Hadoop专题(Day06)

大数据面试题百日更新_Hadoop专题(Day06)在 NameNode HA 中,会出现脑裂问题吗?怎么解决脑裂

大数据面试题百日更新_Hadoop专题(Day06)
文章 2023-12-22 来自:开发者社区

大数据面试题百日更新_Hadoop专题(Day05)

6. Secondary NameNode 不能恢复 NameNode 的全部数据,那如何 保证 NameNode 数据存储安全

大数据面试题百日更新_Hadoop专题(Day05)
文章 2023-12-22 来自:开发者社区

大数据面试题百日更新_Hadoop专题(Day04)

5. Secondary NameNode 了解吗,它的工作机制是怎样的Secondary NameNode 是合并 NameNode 的 edit logs 到 fsimage 文件中; 它的具体工作机制:(1)Secondary NameNode 询问 NameNode 是否需要 checkpoint。直接带回 NameNode 是否检查结果(2)Secondary NameNode 请求执....

大数据面试题百日更新_Hadoop专题(Day04)
文章 2023-12-22 来自:开发者社区

大数据面试题百日更新索引目录

大数据面试题百日更新索引目录大数据的学习重在理解,记忆是理解的前提,为了接下来更好的面试,同时方便自己索引,因此建立此目录.这是背面试题的第一遍Day01:hdfs 读写文件过程Day02 :HDFS 在读取文件的时候,如果其中一个块突然损坏了怎么办HDFS 在上传文件的时候,如果其中一个 DataNode 突然挂掉了怎么办Day03 :NameNode 在启动的时候会做哪些操作Day04 :S....

文章 2023-12-22 来自:开发者社区

大数据面试题百日更新_Hadoop专题(Day03)

4. NameNode 在启动的时候会做哪些操作

大数据面试题百日更新_Hadoop专题(Day03)
文章 2023-12-22 来自:开发者社区

大数据面试题百日更新_Hadoop专题(Day01)

Hadoophadoop 中常问的有三块,第一:存储,问到存储,就把 HDFS 相关的知识点拿出来;第二:计算框架(MapReduce);第三:资源调度框架(yarn)请说下 HDFS 读写流程 这个问题虽然见过无数次,面试官问过无数次,但是就是有人不能完整的说下来,所以 请务必记住。并且很多问题都是从 HDFS 读写流程中引申出来的hdfs 写文件过程1.客户端发起文件上传请求,通过RPC与N....

大数据面试题百日更新_Hadoop专题(Day01)
文章 2023-11-03 来自:开发者社区

6道经典大数据面试题

1、HDFS 读写流程是什么?HDFS(Hadoop Distributed File System)的读写流程如下:写流程:客户端向 NameNode 发送写请求,请求在 HDFS 上创建一个新的文件。NameNode 为该文件分配一些数据块(默认情况下为 128 MB)以及在哪些 DataNode 上存储这些数据块的信息。NameNode 向客户端返回可用于写入数据的 DataNode 列表....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Java面试那些事儿

手把手带您学习Java,开启编程之路。

+关注