大数据开发岗大厂面试30天冲刺 - 日积月累,每日五题【Day04】——Kafka2
面试题 01 Kafka中消费者与消费者组的关系是什么?•消费者组负责订阅Topic,消费者负责消费Topic分区的数据•消费者组中可以包含多个消费者,多个消费者共同消费数据,增加消费并行度,提高消费性能•消费者组的id由开发者指定,消费者的id由Kafka自动分配面试题02、Kafka中Topic和Partition是什么,如何保证Partition数据安全?•Topic:逻辑上实现数据存储的....

大数据开发岗大厂面试30天冲刺 - 日积月累,每日五题【Day03】——Kafka1
面试题 01 什么是消息队列?消息队列就是用于当两个系统之间或者两个模块之间实现消息传递时,基于队列机制实现数据缓存的中间件面试题 02 消息队列有什么好处?•实现解耦,将高耦合转换为低耦合•通过异步并发,提高性能,并实现最终一致性面试题03、Kafka是什么?•Kafka是一个基于订阅发布模式的高性能、高吞吐的实时消息队列系统面试题04、Kafka在大数据中用于什么场景下?•用于实时架构中,实....

大数据开发岗大厂面试30天冲刺 - 日积月累,每日五题【Day02】——Hive2
面试题 01 窗口函数(开窗函数)OVER():用于指定分析函数工作时的数据窗口大小,这个数据窗口大小可能会随着行的变而变化;CURRENT ROW:当前行;n PRECEDING:往前n行数据;n FOLLOWING:往后n行数据;UNBOUNDED:起点,UNBOUNDED PRECEDING 表示从前面的起点UNBOUNDED FOLLOWING表示到后面的终点;LAG(col,n,def....
大数据开发岗面试30天冲刺 - 日积月累,每日五题【Day01】——Hive1
面试题01、 请说下Hive和数据库的区别Hive 和数据库除了拥有类似的查询语言,再无类似之处。1)数据存储位置Hive 存储在 HDFS 。数据库将数据保存在块设备或者本地文件系统中。2)数据更新Hive中不建议对数据的改写。而数据库中的数据通常是需要经常进行修改的,3)执行延迟Hive 执行延迟较高。数据库的执行延迟较低。当然,这个是有条件的,即数据规模较小,当数据规模大到超过数据库的处理....

学了1年大数据,来测测你大数据技术掌握程度?大数据综合复习之面试题15问(思维导图+问答库)
前言大家好,我是ChinaManor,直译过来是中国码农的意思,我希望自己能成为国家复兴道路的铺路人,大数据领域的耕耘者,平凡但不甘于平庸的人。时隔一年,终于把主流的大数据组件全部学完了,学成之时,便是出师之日,那为师便来考考你学的如何:问题1:Rowkey如何设计,设计规则是什么?业务原则:贴合业务,保证前缀是最常用的查询字段唯一原则:每条rowkey唯一表示一条数据组合原则:常用的查询条件组....

大数据Flink面试考题___Flink高频考点,万字超全整理(建议)
引言大家好,我是ChinaManor,直译过来就是中国码农的意思,我希望自己能成为国家复兴道路的铺路人,大数据领域的耕耘者,平凡但不甘于平庸的人。Flink知识回顾考卷如下:选择题1.下面哪个不是 Dataset的转换算子()A. readTextFile B reduce distinct D rebalance2.关于状态管理分类,下面哪个是错误的(A keyed state B opera....

大数据必知必会系列——面试官问能不能手写一个spark程序?[新星计划]
引言 大家好,我是ChinaManor,直译过来就是中国码农的意思,俺希望自己能成为国家复兴道路的铺路人,大数据领域的耕耘者,一个平凡而不平庸的人。 学习大数据差不多一年了,笔者最近在整理大数据学习的笔记资料,这个系列是整理的一些大数据必知必会的知识。 面试官问:看你简历上写spark一项是熟练程度,能....
![大数据必知必会系列——面试官问能不能手写一个spark程序?[新星计划]](https://ucc.alicdn.com/pic/developer-ecology/zpiaduicf3hfi_931ee49e7f8943ea9cc487e7b9ae96fa.png)
大数据必知必会系列——面试官一问就懵:你们做过的项目技术是如何选型的?[新星计划]
引言大家好,我是ChinaManor,直译过来就是中国码农的意思,俺希望自己能成为国家复兴道路的铺路人,大数据领域的耕耘者,一个平凡而不平庸的人。学习大数据差不多一年了,笔者最近在整理大数据学习的笔记资料,这个系列是整理的一些大数据必知必会的知识。面试官前面问技术使用背的 (划掉)回答行云流水,那接下来谈谈项目选型吧,顿时懵了那我们就来好好说一下除了项目代码以外的东西。(一)你们的项目框架版本是....
![大数据必知必会系列——面试官一问就懵:你们做过的项目技术是如何选型的?[新星计划]](https://ucc.alicdn.com/pic/developer-ecology/zpiaduicf3hfi_4745055576f34c228632bd5891d25463.png)
大数据面试题百日更新_Hive专题(Day12)
hive 有索引吗Hive 支持索引,但是 Hive 的索引与关系型数据库中的索引并不相同,比如,Hive 不支持主键或者外键。Hive 索引可以建立在表中的某些列上,以提升一些操作的效率,例如减少 MapReduce 任务中需要读取的数据块的数量。在可以预见到分区数据非常庞大的情况下,索引常常是优于分区的。虽然 Hive 并不像事物数据库那样针对个别的行来执行查询、更新、删除等操作。它更多的用....
大数据面试题百日更新_Hadoop专题_Yarn专题(Day11)
15.yarn 集群的架构和工作原理知道多少YARN 的基本设计思想是将 MapReduce V1 中的 JobTracker 拆分为两个独立的服务:ResourceManager 和 ApplicationMaster。ResourceManager 负责整个系统的资源管理和分配,ApplicationMaster 负责单个应用程序的的管理。1)ResourceManager:RM 是一个全局....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
Java面试那些事儿
手把手带您学习Java,开启编程之路。
+关注