大数据 -13-Hive 启动 Hive DDL DML 增删改查 操作 Hive 的 HQL

点一下关注吧!!!非常感谢!!持续更新!!!
🚀 AI 篇持续更新中!(长期更新)
目前 2025 年 06 月 16 日更新到:AI 炼丹日志-29 - 字节跳动 DeerFlow 深度研究框架 私有部署 测试上手 架构研究,持续打造实用 AI 工具指南!📐🤖
💻 Java 篇正式开启!(300 篇)
目前 2025 年 06 月 16 日更新到:Java-44 深入浅出 Nginx - 底层进程机制 Master Worker 机制原理 常用指令 MyBatis 已完结,Spring 已完结,深入浅出助你打牢基础!
📊 大数据板块已完成多项干货更新(300 篇):
包括 Hadoop、Hive、Kafka、Flink、ClickHouse、Elasticsearch 等二十余项核心组件,覆盖离线+实时数仓全栈!目前 2025 年 06 月 13 日更新到:大数据-278 Spark MLib - 基础介绍 机器学习算法 梯度提升树 GBDT 案例 详解

章节内容
上一节我们完成了:
Hive 简介
安装配置
下载、解压等等操作
修改配置
MariaDB 安装
启动配置
建立用户 远程访问 刷新权限
背景介绍
这里是三台公网云服务器,每台 2C4G,搭建一个 Hadoop 的学习环境,供我学习。之前已经在 VM 虚拟机上搭建过一次,但是没留下笔记,这次趁着前几天薅羊毛的 3 台机器,赶紧尝试在公网上搭建体验一下。
2C4G 编号 h121
2C4G 编号 h122
2C2G 编号 h123


启动 Hive
上一节我们配置好了环境,在 h121 节点上。此时,我们在命令行中执行:
可以看到如下的执行效果

数据定义语言(DDL)
创建数据库
可加 LOCATION 指定 HDFS 路径。
默认存放在 /user/hive/warehouse/mydb.db。
删除数据库
CASCADE 表示删除数据库及其中所有表。
创建表
内部表(Managed Table)
外部表(External Table)
外部表不会随 DROP TABLE 删除数据。
删除表
数据操作语言(DML)
加载数据
插入数据
多表插入
查询结果插入新表
数据查询语言(SELECT)
基本查询
排序与限制
分组与聚合
联合与去重
连接(Join)
内连接
左外连接
右外连接 / 全外连接
测试 Hive
执行结果如下图:

修改配置
增加如下内容:
修改的结果如下图:

命令测试

可以在 Hive 控制台中,执行操作系统的指令:
可以在 Hive 控制台中,执行 DFS 的指令:

一些语句
编写一些语句,对 Hive 进行其他简单的测试:

版权声明: 本文为 InfoQ 作者【武子康】的原创文章。
原文链接:【http://xie.infoq.cn/article/1d79f333231a676a2cc89cba4】。文章转载请联系作者。
评论