写点什么

Hive SQL

0 人感兴趣 · 12 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/fc/fcf9e41592072babfabd616f7c9d07ca.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

hive etl 通过 ETL 导出 Hive 中的数据

Hive 数据如何导出到关系型数据库中,ETL 导出 Hive 数据

大数据培训:HiveSQL 技术优化与面试

用户头像
@零度
2022-03-15

​当只有一个distinct字段时,如果不考虑Map阶段的Hash GroupBy,只需要将GroupBy字段和Distinct字段组合为map输出key,利用mapreduce的排序,大数据培训同时将GroupBy字段作为reduce的key,在reduce阶段保存LastKey即可完成去重:

https://static001.geekbang.org/infoq/b4/b40191538ff0919c21a857e102c70b30.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

hive 性能调优实战 - 读书笔记

用户头像
聚变
2022-02-27

https://www.jianshu.com/p/21ce1cd53cca

Hive SQL 底层执行原理

本文结构采用宏观着眼,微观入手,从整体到细节的方式剖析 Hive SQL 底层原理。第一节先介绍 Hive 底层的整体执行流程,然后第二节介绍执行流程中的 SQL 编译成 MapReduce 的过程,第三节剖析 SQL 编译成 MapReduce 的具体实现原理。

大数据开发之 Hive SQL 的优化分享

用户头像
@零度
2022-01-04

​hive的优化主要分为:配置优化、SQL语句优化、任务优化等方案。 其中在开发过程中主要涉及到的可能是SQL优化这块。 优化的核心思想是: 减少数据量(例如分区、列剪裁); 避免数据倾斜(例如加参数、Key打散); 避免全表扫描(例如on添加加上分区等

大数据开发之 Hive SQL 内置函数

用户头像
@零度
2021-12-27

​Hive内部提供了很多函数给开发者使用,包括数学函数,集合函数,大数据培训类型转换函数,日期函数,条件函数,字符函数,聚合函数,表生成函数等等,这些函数都统称为内置函数。

HIVE 中临时表创建

用户头像
编程江湖
2021-12-22

在我们编写SQL 时候,常常需要使用到临时表。 然后我们根据这个临时表,进行之后的操作,但是创建临时表有一定的开销。

https://static001.geekbang.org/infoq/6f/6f5b9ae11c45ce2a1ffc2aef0d6d64ab.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

万字长文详解 HiveSQL 执行计划

Hive SQL的执行计划描述SQL实际执行的整体轮廓,通过执行计划能了解SQL程序在转换成相应计算引擎的执行逻辑,掌握了执行逻辑也就能更好地把握程序出现的瓶颈点,从而能够实现更有针对性的优化。此外还能帮助开发者识别看似等价的SQL其实是不等价的,看似不等

https://static001.geekbang.org/infoq/bc/bce73cd199456e782f9de78f17f2fef5.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

hive 窗口函数 / 分析函数详细剖析

在sql中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的。但是有时我们想要既显示聚集前的数据,又要显示聚集后的数据,这时我们便引入了窗口函数。窗口函数又叫OL

Hive SQL_Hive SQL技术文章_InfoQ写作社区