2022年最强大数据面试宝典(全文50000字,建议收藏)(五)
5. 介绍下Flink的容错机制(checkpoint)Checkpoint机制是Flink可靠性的基石,可以保证Flink集群在某个算子因为某些原因(如 异常退出)出现故障时,能够将整个应用流图的状态恢复到故障之前的某一状态,保证应用流图状态的一致性。Flink的Checkpoint机制原理来自“Chandy-Lamport...

2022年最强大数据面试宝典(全文50000字,建议收藏)(四)
35. Spark Master 使用 Zookeeper 进行 HA,有哪些源数据保存到 Zookeeper 里面?spark 通过这个参数 spark.deploy.zookeeper.dir 指定 master 元数据在 zookeeper 中保存的位置,包括 Worker,Driver 和 Application 以及 Executors。standby 节点要从 zk 中,获得元数据信....
2022年最强大数据面试宝典(全文50000字,建议收藏)(三)
2. Spark 有哪些组件?master:管理集群和节点,不参与计算。worker:计算节点,进程本身不参与计算,和 master 汇报。Driver:运行程序的 main 方法,创建 spark context 对象。spark context:控制整个 application 的生命周期,包括 dagsheduler 和 task scheduler 等组件。client:用户提交程序的入....
2022年最强大数据面试宝典(全文50000字,建议收藏)(一)
此套面试题来自于各大厂的真实面试题及常问的知识点,如果能理解吃透这些问题,你的大数据能力将会大大提升,进入大厂指日可待复习大数据面试题,看这一套就够了!本文目录:一、Hadoop二、Hive三、Spark四、Kafka五、HBase六、Flink七、数仓业务方面八、算法本文因内容较多,带目录的PDF版查看是比较方便的:2022年最强大数据面试宝典PDF版HadoopHadoop中常问的就三块,第....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
Java面试那些事儿
手把手带您学习Java,开启编程之路。
+关注