阿里云文档 2025-01-21

Flink Hive SQL作业快速入门

实时计算Flink版支持使用Hive方言创建批处理作业,通过兼容Hive SQL语法增强与Hive互操作性,便于从现有Hive作业平滑迁移至实时计算管理控制台。

文章 2023-12-29 来自:开发者社区

Hive SQL 优化

1.案例一原sql:select count(case when a.id in (select id from b) then 1 esle 0) from a;结果总共数据:727  耗时:2020-12-28 17:38:31 INFO Cost time is: 568.197s改造后:select count(case when b.id is not null then 1....

阿里云文档 2023-09-03

如何配置HiveSQL类型作业_EMR on ECS_开源大数据平台 E-MapReduce(EMR)

本文介绍如何配置Hive SQL类型的作业。

阿里云文档 2023-08-15

MaxCompute中运算符、类型转换和内建函数分别在普通模式和Hive兼容模式下使用有什么区别

本文为您介绍MaxCompute中运算符、类型转换和内建函数分别在普通模式和Hive兼容模式下使用的区别。

阿里云文档 2022-09-07

Dataphin即席sql报错Couldnotinitializeclassorg.apache.hadoop.hive.common.type.HiveDate

问题描述Dataphin 即席sql报错Could not initialize class org.apache.hadoop.hive.common.type.HiveDate。问题原因插入数据后,查询表报错,表结构有date字段,输入类型有问题。解决方案把表字段改成string类型,然后重新插...

阿里云文档 2022-07-20

问题描述Quick BI新建hive数据源后将简单SQL放到数据集中运行报错io.grpc.StatusRuntimeException: INTERNAL: java.sql.SQLException: org.apache.spark.sql.catalyst.parser.ParseExcep...

文章 2022-04-27 来自:开发者社区

Hive SQL优化思路

Hive的优化主要分为:配置优化、SQL语句优化、任务优化等方案。其中在开发过程中主要涉及到的可能是SQL优化这块。优化的核心思想是:减少数据量(例如分区、列剪裁)避免数据倾斜(例如加参数、Key打散)避免全表扫描(例如on添加加上分区等)减少job数(例如相同的on条件的join放在一起作为一个任务)HQL语句优化1. 使用分区剪裁、列剪裁在分区剪裁中,当使用外关联时,如果将副表的过滤条件写在....

文章 2016-05-05 来自:开发者社区

hive sql 优化

Hive是将符合SQL语法的字符串解析生成可以在Hadoop上执行的MapReduce的工具。 使用Hive尽量按照分布式计算的一些特点来设计sql,和传统关系型数据库有区别, 所以需要去掉原有关系型数据库下开发的一些固有思维。 基本原则: 1:尽量尽早地过滤数据,减少每个阶段的数据量,对于分区表要加分区,同时只选择需要使用到的字段 select … from A join B on A.ke.....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

数据库

分享数据库前沿,解构实战干货,推动数据库技术变革

+关注