windows 下 Hive 搭建踩坑汇总
前言:
Hive 是一个基于 Hadoop 的数据仓库工具,以一种类 SQL 的 HQL 语句操作 Hadoop 数据仓库(HDFS 等)。所以本地 windows 安装前需要先搭建 Hadoop。前面文章已经大概介绍了环境搭建和踩坑汇总,所以这里也依旧只是介绍基础的安装方法。因为关于 Hive 的安装,网上其实有很多文章,这里更多的是小北在安装过程中的遇到的各种坑的汇总以及解决方法。
环境:
\1. windows10
\2. hadoop2.7.7
\3. mysql-connector-java-5.1.7-bin.jar
\4. hive2.1.1,点击下载
简易安装:
1. Hadoop 本地搭建,略过。
2. Hive 下载安装,环境变量配置,略过。
3. Hive config 配置。
(1). 找到 hive 的 conf 下的以下四个文件再按下面方式修改。
data:image/s3,"s3://crabby-images/97d65/97d65fd185703d2a7e1a39d4c0a03ef4b3e65ab8" alt=""
4. 创建目录。
(1). 先将 mysql-connector-java-5.1.7-bin.jar 文件移动到 hive 的 lib 中,如下。
data:image/s3,"s3://crabby-images/edcb0/edcb007337d8c0118da33daa332f7d2dfa35b442" alt=""
(2). 现在 hive 根目录下创建一个 my_hive 再创建以下四个目录。
data:image/s3,"s3://crabby-images/b0b7c/b0b7c3ad72348d5bda50790e7362dae059f2932f" alt=""
5. 修改 hive-env.sh
(1). 找到 hive 的 conf 下的 hive-env.sh 并添加以下几个配置。
data:image/s3,"s3://crabby-images/9410c/9410c11483d817932a9134dfd52104b732bad26e" alt=""
6. 修改 hive-site.xml
(1). 找到 hive 的 conf 下的 hive-site.xml。
(2). 修改以下几个选项。
7. 在 Hadopp 上创建 HDFS 目录
(1). 创建以下目录并授予 777 权限。
data:image/s3,"s3://crabby-images/1bfec/1bfecd079618068f91d4e832e3cd30741938270f" alt=""
data:image/s3,"s3://crabby-images/aefe5/aefe5de33b8845717e92237f38cbfc8bfb6f5066" alt=""
(2). 在 hadoop 控制台上查看。
data:image/s3,"s3://crabby-images/7e96e/7e96e057cefde970c746627336c57f26d686da87" alt=""
8. 创建 MySQL 数据库
(1). 创建 hive 数据库,可以以命令或者 navicat 方式创建。
data:image/s3,"s3://crabby-images/49624/496244d8076de116e0233e2ad91e491fe7326019" alt=""
9. 启动 Hive metastore
(1). 安装完毕只需要启动一次,启动后 Mysql 的 hive 数据库会多出以下表格。
data:image/s3,"s3://crabby-images/d9f99/d9f99843210565abf45ea5b182e684baa94244ae" alt=""
10. 启动 hive
(1). 如果配置了 hive 环境变量,如果没有则进入 hive 目录的 bin 文件下,输入 hive。
(2). 启动成功没有报错,示例创建一张表格,输入以下 HQL 语句创建。
(3). 进入 hadoop 的控制台就可以查看了。
data:image/s3,"s3://crabby-images/c7c44/c7c440c7f9410a0660fb36372d48bf0019a7e901" alt=""
11. HQL 几个常见命令
报错集锦
1. HiveConf of name hive.metastore.local does not exist
去除hive.metastore.localtrue
2. Version information not found in metastore. hive.metastore.schema.verification is not enabled so recording the schema version 2.1.0
在 hive 数据库的 version 添加一条记录,如下
data:image/s3,"s3://crabby-images/95686/956861973c588dadb98be73e12c138c52a211704" alt=""
3. applying authorization policy on hive configuration: java.net.URISyntaxException: Relative path in absolute URI: {system:java.io.tmpdir%7D/%7Bsystem:user.name%7D Beeline version 2.1.1 by Apache Hive
打开 hive-site.xml,找到 hive.exec.local.scratchdir, 将带有 system:的标识全部去掉,如下
data:image/s3,"s3://crabby-images/5d852/5d852e75bc318f7d81682e830126a5803e8f9260" alt=""
4. hadoop 的 web 控制台文件系统,打开某个目录报错: Permission denied: user=dr.who, access=READ_EXECUTE, inode="/tmp/hive/Administrator":Administrator:supergroup:drwx------
进入 hadoop 命令,输入 hadoop fs -chmod 777 /tmp/hive
data:image/s3,"s3://crabby-images/f3bda/f3bdaf9c0917ab6a199816eabf377f291335cce0" alt=""
附
Default 数据仓库默认位置:hdfs 上的:/user/hive/warehouse 路径下
data:image/s3,"s3://crabby-images/ce06f/ce06fafdfd30d845dbd96c72ef7cb17fc229ea8d" alt=""
评论