hive 的 struct、map與array 類型

2023-03-22 03:48:22

hive支援struct,map,array三種集合類型

1、struct

與C語言、golang中的struct類似,可以通過.文法來通路

定義一個包含struct字段的表

create table test2(
	field1 struct<name:string,age:int> comment "test field"
) 
row format delimited fields terminated by "," 
collection items terminated by ":";

其中

row format delimited fields terminated by ","

表示字段之間用",“分割

collection items terminated by ":"

; 字段中各個元素項之間用”:"分割

然後導入資料,可以使用sql語句和檔案的方式,首先是sql語句注意: 這裡使用的是named_struct函數

insert into test2(field1)values(named_struct("name",'zhangsan',"age",25));
insert into test2(field1)values(named_struct("name","lisi","age",23));

從檔案導入,建立一個test.txt,内容如下

name:wangwu|age:27
name:zhaoliu|age:28

使用load data語句從本地導入

使用.文法查詢資料

-- 查詢所有資料
select * from test2;
-- 查詢name字段
select field1.name from test2;
-- 查詢name為zhangsan的記錄
select field1 from test2 where field1.name = "zhangsan";

2、map

同struct,map的用法基本相似,以下為建立一個map類型字段

create table test3(
	field2 map<string,string>
) row format delimited fields terminated by ',' 
collection items terminated by "|" map keys terminated by ":";

map keys terminated by ":"

表示鍵值對之間用":"來分割

同樣的,先使用sql方式插入

再導入檔案,檔案内容如下:

map的通路通過map[key]的形式進行,測試一下

select * from test3;
select field2["name"] as name,field2["age"] as age from test3;
select * from test3 where field2["age"] > 25;

3、array

與所有支援數組的程式設計語言一緻,使用array[下标]的方式通路,建立一個array類型字段

插入資料

insert into test4(field4)values(array("zhangsan","lisi","wangwu"));
insert into test4(field4)values(`array`("lily","bob","alice"));
insert into test4(field4)values(`array`("A","B","C"));

查詢測試

select * from test4;
select field4[0] from test4;
select * from test4 where field4[0]="zhangsan";

hive 的 struct、map與array 類型

1、struct

2、map

3、array

繼續閱讀

jdk1.7+Eclipse+Maven3.5+Hadoop2.7.3建構hadoop項目

HDFS指令行工具

【51CTO學院三周年】自學路上的伴侶

線上教育巨頭多鄰國Duolingo入華一周年，中國市場馬力全開

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

Sql優化一：sql語句優化

Nacos 2.0 更新前後性能對比壓測

尚矽谷—韓順平—圖解 Java設計模式（結構型）（55～）

Storm編譯打包過程中遇到的一些問題及解決方法

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

9.spark Core 進階2--Cashe

淺談企業活動中進行資料分析的重要性

Ambari介紹和架構原理

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark