ARM+麒麟大数据环境搭建:Flink
第1章概述1.1编写目的暂无1.2业务背景暂无第2章组件介绍2.1组件介绍与架构说明Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink设计为在所有常见的集群环境中运行,以内存速度和任何规模执行计算。Apache Flink是一个分布式系统,需要计算资源才能执行应用程序。Flink与所有常见的集群资源管理器(如Hadoop YARN,Apache ....
ARM+麒麟大数据环境搭建:Kafka
第1章概述1.1编写目的暂无1.2业务背景暂无第2章组件介绍2.1组件介绍与架构说明kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。kafka是整个中台的流数据处理的重要组成部....
ARM+麒麟大数据环境搭建:Hive
第1章概述1.1编写目的暂无1.2业务背景暂无第2章组件介绍2.1组件介绍与架构说明hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。hive是整个中台的数据处理的重要组成....
ARM+麒麟大数据环境搭建:Airflow
第1章概述1.1编写目的暂无1.2业务背景暂无第2章组件介绍2.1组件介绍与架构说明airflow 介绍 airflow是一款开源的,分布式任务调度框架,它将一个具有上下级依赖关系的工作流,组装成一个有向无环图,其作为整个中台的作业调度中心,为数据批处理提供基础服务。2.2逻辑部署拓扑airflow的运行流程从逻辑上可为分为两个节点,调度器Scheduler 和执行器:Executor,调度器是....
ARM+麒麟大数据环境搭建:MySQL8
第1章概述1.1编写目的暂无1.2业务背景暂无第2章组件介绍2.1组件介绍与架构说明 mysql是整个平台的基础组件之一,为其他组件提供元数据存储服务,并作为中台RDB组件,提供批及流数据处理的结果入库。2.2部署拓扑部署在node4上2.3依赖环境硬件:Phytium ARM CPU,银河麒麟v10 内核版本4.19.90-17 arm64 桌面版2.4界面效果2.4.1安装完成后的运行效果2....
ARM+麒麟大数据环境搭建:ZK
第1章概述1.1编写目的暂无1.2业务背景暂无第2章组件介绍2.1组件介绍与架构说明Zookeeper在整个数据中台环境中起到协调器的作用,提供数据中台的统一注册中心,用来保持数据中台内相关组件的一致性。2.2逻辑部署拓扑Zk采用奇数节点进行集群部署,内部分为leader与follow两类角色节点,内部通过相关算法实现高可用,支持leader选举生成与移动。2.3物理部署拓扑在1主2从配置下,三....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。