在JSON數據集創建表

在JSON數據集創建表;需要SerDe JAR。

寫的ram.sankarasubramanian

去年發表在:2022年5月31日

在本文中,我們介紹如何創建一個表在使用SerDe JSON數據集。

下載JSON SerDe JAR

  1. 打開hive-json-serde 1.3.8下載頁麵。
  2. 點擊json-serde-1.3.8-jar-with-dependencies.jar下載的文件json-serde-1.3.8-jar-with-dependencies.jar
刪除

信息

你可以檢查Hive-JSON-SerdeGitHub回購在JAR的更多信息,包括源代碼。

在集群上安裝JSON SerDe JAR

  1. 在工作區中選擇您的集群。
  2. 單擊選項卡。
  3. 點擊安裝新
  4. 在庫源按鈕列表中,選擇上傳
  5. 在圖書館按鈕類型列表中,選擇JAR
  6. 點擊刪除JAR這裏
  7. 選擇json-serde-1.3.8-jar-with-dependencies.jar文件。
  8. 點擊安裝

在create table語句中配置SerDe屬性

% sql行格式SERDE org.openx.data.jsonserde。JsonSerDe org.apache.hadoop.mapred作為INPUTFORMAT存儲。TextInputFormat OUTPUTFORMAT org.apache.hadoop.hive.ql.io。HiveIgnoreKeyTextOutputFormat“位置”< path-to-json-files >”

例如:

% sql create table < name-of-table > (timestamp_unix字符串,字符串,評論start_date字符串,end_date字符串)分區,(yyyy字符串,mm字符串,dd字符串)行格式SERDE org.openx.data.jsonserde。JsonSerDe org.apache.hadoop.mapred作為INPUTFORMAT存儲。TextInputFormat OUTPUTFORMAT org.apache.hadoop.hive.ql.io。HiveIgnoreKeyTextOutputFormat“位置”< path-to-json-files >”這個例子創建了一個表分區的列yyyy,毫米,和弟弟。

運行後修複table語句創建表

例如:

% sql msck修理表< name-of-table >