文章 2024-05-06 来自:开发者社区

Hive 数仓及数仓设计方案

数仓(Data Warehouse) 数据仓库存在的意义在于对企业的所有数据进行汇总,为企业各个部门提供一个统一、规范的出口。做数仓就是做方案,是用数据治理企业的方案。 数据仓库的特点 面向主题集成公司中不同的部门都会去数据仓库中拿数据,把独立从数据仓库中拿数据的单元,称为一个主题。数据仓库中的数据是从各个分散的数据库中抽取出来的ÿ...

Hive 数仓及数仓设计方案
文章 2023-10-09 来自:开发者社区

如何在 hive udf 中访问配置数据-踩坑记录,方案汇总与对比-udf中可以写sql吗?

近日我司有个大数据业务系统在某客户现场实时部署时,遇到了一个Hive udf的使用问题,这个问题比较难排查,因为涉及到对Hive的架构原理以及hive sql 解析优化和执行的细节的理解。在此跟大家分享总结下,希望对大家以后使用hive sql 尤其是udf 的编写能有所帮助。一。问题现象该客户使用的是 cdh6.2,对 hive 开启了 kerberos 安全认证也使用了sentry插件来进行....

问答 2022-07-20 来自:开发者社区

Flink sql读取hive性能慢,请问有优化的方案吗?

Flink sql读取hive性能慢,请问有优化的方案吗?

问答 2020-06-03 来自:开发者社区

flink 读hive维表现在的方案是什么? #Flink

flink 读hive维表现在的方案是什么? #Flink

问答 2019-08-29 来自:开发者社区

hive库的异地同步有什么好的方案?

本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。 https://developer.aliyun.com/article/706511 点击链接欢迎加入感兴趣的技术领域群。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐