写点什么

hive 踩过的小坑

  • 2022 年 5 月 11 日
  • 本文字数:534 字

    阅读完需:约 2 分钟

Hive 体系结构




主要分为以下几个部分:


  • 用户接口


用户接口主要有三个:CLI,Client 和 WUI。其中最常用的是 CLI,Cli 启动的时候,会同时启动一个 Hive 副本。Client 是 Hive 的客户端,用户连接至 Hive Server。在启动 Client 模式的时候,需要指出 Hive 《一线大厂 Java 面试题解析+后端开发学习笔记+最新架构讲解视频+实战项目源码讲义》无偿开源 威信搜索公众号【编程进阶路】 Server 所在节点,并且在该节点启动 Hive Server。 WUI 是通过浏览器访问 Hive。


  • 元数据存储


Hive 将元数据存储在数据库中,如 mysql、derby。Hive 中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。


  • 解释器、编译器、优化器、执行器


解释器、编译器、优化器完成 HQL 查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在 HDFS 中,并在随后由 MapReduce 调用执行。


  • Hadoop


Hive 的数据存储在 HDFS 中,大部分的查询由 MapReduce 完成(包含 * 的查询,比如 select * from tbl 不会生成 MapReduce 任务)。




加载数据方式




  • 从本地文件系统中加载数据


load data local inpath "/opt/test2.txt" into table wyp;


坑 1、local 必须是 hiver server 所在机器的路径;


坑 2、test2 文件 owner 需要为执行命令的用户;

用户头像

还未添加个人签名 2022.04.13 加入

还未添加个人简介

评论

发布
暂无评论
hive踩过的小坑_Java_爱好编程进阶_InfoQ写作社区