hive

0 人感兴趣 · 12 次引用

  • 推荐
  • 最新

hive 拉链表优化·百亿量级数据支持准实时更新

用户头像
誓约·追光者 2020 年 8 月 12 日

通过hive sql实现百亿量级数据的准实时更新,保证数据强一致性,改动极小,对上下游没有任何影响

https://static001.geekbang.org/infoq/39/3936b9caa775a175bb843e9e99510807.jpeg?x-oss-process=image/resize,w_416,h_234

大数据简介 & 架构 (一)

用户头像
dony.zhang 2020 年 9 月 2 日

随着近年来,信息技术迅猛发展,通过各种终端设备收集大量的用户信息、操作行为等日志,数据的来源和数量正以前所未有的速度增长。对这些数据进行分析、挖掘、机器学习,实现个性化营销、智能推荐等应用,为公司挖掘更多的商业价值,为用户带来更好的体验。

Flink x Zeppelin ,Hive Streaming 实战解析

用户头像
Apache Flink 2020 年 8 月 4 日

Flink 1.11 正式发布已经三周了,其中最吸引我的特性就是 Hive Streaming。正巧 Zeppelin-0.9-preview2 也在前不久发布了,所以就写了一篇 Zeppelin 上的 Flink Hive Streaming 的实战解析。

https://static001.geekbang.org/infoq/12/12f805096ae120ead751afaf328ba7d4.jpeg?x-oss-process=image/resize,w_416,h_234

如何搭建 Hive 环境

用户头像
Rayjun 2020 年 7 月 12 日

Hive 是一个 Hadoop 平台的上的数据仓库工具,可以将结构化的的诗句映射成一张表,并提供了类似 SQL 的查询的功能。

https://static001.geekbang.org/infoq/a5/a57a850dfea866b530236d03e6274f55.png?x-oss-process=image/resize,w_416,h_234

Hive 中的 GroupBy, Distinct 和 Join

用户头像
tkanng 2020 年 5 月 2 日

深度剖析Hive中的 Groupby,Distinct 与 Join

Hive 底层执行引擎的深度剖析(免费)

用户头像
奈学教育 2020 年 6 月 2 日

《Hive底层执行引擎的深度剖析》的公开课,助力懵懂小伙伴进阶真正的Hive顶尖高手。

https://static001.geekbang.org/infoq/25/25557b710250321c8595200287c83a5b.jpeg?x-oss-process=image/resize,w_416,h_234

第 12 周命题作业

用户头像
hifly 2020 年 9 月 2 日

分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?

windows 平台 python3 使用 impyla 连接 hive 问题汇总

用户头像
誓约·追光者 2020 年 9 月 16 日

windows下python3通过impala连接hive遇到的问题和解决方法

时空碰撞优化系列·二

用户头像
誓约·追光者 2020 年 9 月 22 日

对之前的方案补充了计算量上的优化

hive_hive资料文章-InfoQ写作平台