Hive 中,同时存在 map、array、struct 这三种格式,应如何在建表语句中指定分隔符?
Hive中存在map、array、和struct格式,那如果同时存在这三种格式时,建表语句的分隔符应该怎么指定呢?
一、 先说答案
先说答案:
字段解释:
其中需要解释的地方其实只有两个:
①. collection items terminated by '_' ,在hive中,map、array、struct都使用collection items terminated by来指定,所以只能共用一个分隔符。
②. lines terminated by '\n', 不写也行,行分隔符默认就是 \n
二、 举个例子
假设有如下数据,需要插入到hive相关表中
首先,将其整理成一条数据:
注意分隔符
建表
将数据先vim到文档中,再读取到hive中
访问方式
访问map:
版权声明: 本文为 InfoQ 作者【Geek_de9857】的原创文章。
原文链接:【http://xie.infoq.cn/article/f2c68ef362b24ae96d34004e9】。文章转载请联系作者。
评论