大数据知识面试题-Flink
1. 简单介绍一下FlinkFlink是一个面向流处理和批处理的分布式数据计算引擎,能够基于同一个Flink 运行,可以提供流处理和批处理两种类型的功能。 在 Flink 的世界观中,一切都是由流组成的,离线数据是有界的流;实时数据是一个没有界限的流:这就是所谓的有界流和无界流。2. Flink的运行必须依赖Hadoop组件吗Flink可以完全独立于Hadoop,在不依赖Hadoop组件下运行。....

大数据知识面试题-Spark
1、spark1.1、spark介绍Apache Spark是用于大规模数据处理的统一分析计算引擎Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量硬件之上,形成集群。1.2、spark与Hadoop的区别 尽管Spark相对于Hadoop而言具有较大优势,但Spark并不能完全替代Hadoop,Spark主要用于替代Ha....

大数据知识面试题-Hbase
1.1、HBASE的架构1、HMaster功能:1) 监控RegionServer 2) 处理RegionServer故障转移 3) 处理元数据的变更 4) 处理region的分配或移除 5) 在空闲时间进行数据的负载均衡 6) 通过Zookeeper发布自己的位置给客户端2、RegionServer功能:1) 负责存储HBase的实际数据 2) 处理分配给它的Region 3) 刷新缓存到HD....

大数据知识面试题-Hive
1.1、Hive 数据模型Hive中所有的数据都存储在HDFS中,没有专门的数据存储格式在创建表时指定数据中的分隔符,Hive 就可以映射成功,解析数据。Hive中包含以下数据模型:**db:**在hdfs中表现为hive.metastore.warehouse.dir目录下一个文件夹**table:**在hdfs中表现所属db目录下一个文件夹**external table:**数据存放位置可....

大数据知识面试题-MapReduce和YARN
MapReduce1、介绍MapReduce MapReduce的思想核心是“分而治之”,适用于大量复杂的任务处理场景(大规模数据处理场景)。 Map负责“分”,即把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆分的前提是这些小任务可以并行计算,彼此间几乎没有依赖关系。 Reduce负责“合”,即对map阶段的结果进行全局汇总。 图:MapReduce思想模型2、会写Wordcoun....

大数据知识面试题-Hadoop
Hadoop1.1、介绍Hadoop广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。狭义上说,Hadoop指Apache这款开源框架,它的核心组件有:。HDFS(分布式文件系统):解决海量数据存储。YARN(作业调度和集群资源管理的框架):解决资源任务调度。MAPREDUCE(分布式运算编程框架):解决海量数据计算1.2、Hadoop特性优点扩容能力(Scalable):....

阿里云大数据开发三面面经,已过,面试题已配答案
1、SQL题 自由发挥 2、实习经历 根据自己的来就行,一面面试题也有说 3、Hadoop和Spark的相同点和不同点 相同点: Hadoop和Spark都是并行计算,两者都是用MR模型进行计算。 &n...

大数据集群资源预估规划【适用于面试与工作集群规划】
我们在实际工作,或者面试中,经常会遇到这么一个问题,集群该如何规划,一台机器多少磁盘,多少内存,多少core等。关于公司集群规模,有的几台,有的几百或有的则几千台,那么这几百几千台机器他们的配置是怎么样的?这里先说下大概,对于大多数公司来说,集群有的10来台,而对于电信行业,一个地方的可能有几百台,对于一线互联网集群规模就比较大一些,上千台是比较常见的。 那么如果我们....

Java大数据面试复习30天冲刺 - 日积月累,每日五题【Day04】——JavaSE
创建线程有几种方式1.通过继承Thread类实现,实现简单但不可以继承其他类,多个线程之间无法共享该线程类的实例变量。2.实现Runnable接口,较继承Thread类,避免继承的局限性,适合资源共享。3.使用Callable,方法中可以有返回值,并且抛出异常。4.创建线程池实现,线程池提供了一个线程队列,队列中保存所有等待状态的线程,避免创建与销毁额外开销,提高了响应速度。https://bl....
Java大数据面试复习30天冲刺 - 日积月累,每日五题【Day03】——JavaSE
JDK JRE JVM 的区别JDK(Java Development Kit)是整个 Java 的核心,是 java 开发工具包,包括了 Java 运行环境 JRE、Java 工具和 Java 基础类库。JRE(Java Runtime Environment)是运行 JAVA 程序所必须的环境的集合,包含 java 虚拟机和 java 程序的一些核心类库。JVM 是 Java Virtual....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
Java面试那些事儿
手把手带您学习Java,开启编程之路。
+关注