在本文中,我們介紹如何創建一個表在使用SerDe JSON數據集。
下載JSON SerDe JAR
- 打開hive-json-serde 1.3.8下載頁麵。
- 點擊json-serde-1.3.8-jar-with-dependencies.jar下載的文件json-serde-1.3.8-jar-with-dependencies.jar。
在集群上安裝JSON SerDe JAR
- 在工作區中選擇您的集群。
- 單擊庫選項卡。
- 點擊安裝新。
- 在庫源按鈕列表中,選擇上傳。
- 在圖書館按鈕類型列表中,選擇JAR。
- 點擊刪除JAR這裏。
- 選擇json-serde-1.3.8-jar-with-dependencies.jar文件。
- 點擊安裝。
在create table語句中配置SerDe屬性
% sql行格式SERDE org.openx.data.jsonserde。JsonSerDe org.apache.hadoop.mapred作為INPUTFORMAT存儲。TextInputFormat OUTPUTFORMAT org.apache.hadoop.hive.ql.io。HiveIgnoreKeyTextOutputFormat“位置”< path-to-json-files >”
例如:
% sql create table < name-of-table > (timestamp_unix字符串,字符串,評論start_date字符串,end_date字符串)分區,(yyyy字符串,mm字符串,dd字符串)行格式SERDE org.openx.data.jsonserde。JsonSerDe org.apache.hadoop.mapred作為INPUTFORMAT存儲。TextInputFormat OUTPUTFORMAT org.apache.hadoop.hive.ql.io。HiveIgnoreKeyTextOutputFormat“位置”< path-to-json-files >”這個例子創建了一個表分區的列yyyy,毫米,和弟弟。
運行後修複table語句創建表
例如:
% sql msck修理表< name-of-table >