文章 2023-04-25 来自:开发者社区

数据治理三-Atlas与Hive数据集成

一、安装环境JDK 1.8二、安装Hadoop1、下载hadoophttp://mirror.bit.edu.cn/apache/hadoop/ 选择合适的版本下载hadoopwget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-3.3.0/hadoop-3.3.0.tar.gz执行 进行解压,为了方便使用吗,mv进行修改名称1. t....

数据治理三-Atlas与Hive数据集成
问答 2022-07-20 来自:开发者社区

测试用的公共资源组,但是hive数据集成显示不支持此资源组怎么办?

测试用的公共资源组,但是hive数据集成显示不支持此资源组怎么办?

文章 2020-07-23 来自:开发者社区

字节跳动基于 Flink 的 MQ-Hive 实时数据集成

在数据中台建设过程中,一个典型的数据集成场景是将 MQ (Message Queue,例如 Kafka、RocketMQ 等)的数据导入到 Hive 中,以供下游数仓建设以及指标统计。由于 MQ-Hive 是数仓建设第一层,因此对数据的准确性以及实时性要求比较高。 本文主要围绕 MQ-Hive 场景,针对目前字节跳动内已有解决方案的痛点,提出基于 Flink 的实时解决方案,并介绍新方案在字节跳....

字节跳动基于 Flink 的 MQ-Hive 实时数据集成

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。作为阿里巴巴数据中台的建设者,DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论,同时与数万名政务/金融/零售/互联网/能源/制造等客户携手,助力产业数字化升级。

+关注