文章 2022-04-27 来自:开发者社区

2022年最强大数据面试宝典(全文50000字,建议收藏)(五)

5. 介绍下Flink的容错机制(checkpoint)Checkpoint机制是Flink可靠性的基石,可以保证Flink集群在某个算子因为某些原因(如 异常退出)出现故障时,能够将整个应用流图的状态恢复到故障之前的某一状态,保证应用流图状态的一致性。Flink的Checkpoint机制原理来自“Chandy-Lamport...

文章 2022-04-27 来自:开发者社区

2022年最强大数据面试宝典(全文50000字,建议收藏)(四)

35. Spark Master 使用 Zookeeper 进行 HA,有哪些源数据保存到 Zookeeper 里面?spark 通过这个参数 spark.deploy.zookeeper.dir 指定 master 元数据在 zookeeper 中保存的位置,包括 Worker,Driver 和 Application 以及 Execut...

2022年最强大数据面试宝典(全文50000字,建议收藏)(四)

Java面试疑难点解析 - 面试技巧及语言基础

61 课时 |
3837 人已学 |
免费

Java面试疑难点解析 - Java Web开发

36 课时 |
753 人已学 |
免费

Java面试疑难点解析 - 系统架构及项目设计

25 课时 |
1581 人已学 |
免费
开发者课程背景图
文章 2022-04-27 来自:开发者社区

2022年最强大数据面试宝典(全文50000字,建议收藏)(三)

2. Spark 有哪些组件?master:管理集群和节点,不参与计算。worker:计算节点,进程本身不参与计算,和 master 汇报。Driver:运行程序的 main 方法,创建 spark context 对象。spark context:控制整个 applic...

文章 2022-04-27 来自:开发者社区

2022年最强大数据面试宝典(全文50000字,建议收藏)(二)

16. YARN的任务提交流程是怎样的当jobclient向YARN提交一个应用程序后,YARN将分两个阶段运行这个应用程序:一是启动ApplicationMaster;第二个阶段是由ApplicationMaster创建应用程序,为它申请资源,监控运行直到结束。 具体步骤如下:用户向YARN提交一个应用程序,并指定Appli...

2022年最强大数据面试宝典(全文50000字,建议收藏)(二)
文章 2022-04-27 来自:开发者社区

2022年最强大数据面试宝典(全文50000字,建议收藏)(一)

此套面试题来自于各大厂的真实面试题及常问的知识点,如果能理解吃透这些问题,你的大数据能力将会大大提升,进入大厂指日可待复习大数据面试题,看这一套就够了!本文目录:一、Hadoop二、Hive三、Spark四、Kafka五、HBase六、Flink七、数仓业务方面八、算法本文因内容较多,带目录的PDF...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。