蜂巢表

本文演示如何導入蜂巢表從雲存儲到Databricks使用外部表。

第一步:展示創建表格聲明

發出一個顯示創建表格<表>命令在Hive命令行上查看創建表的語句。

蜂巢>顯示創建表格wikicc好吧創建表格wikicc國家字符串int格式SERDE“org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe”存儲作為INPUTFORMAT“org.apache.hadoop.mapred.TextInputFormat”OUTPUTFORMAT“org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat”位置' < path-to-table >”TBLPROPERTIES“totalSize”“2335”numRows的“240”“rawDataSize”“2095”“COLUMN_STATS_ACCURATE”“真正的”“numFiles”' 1 '“transient_lastDdlTime”“1418173653”

步驟2:簽發創建外部表格聲明

如果返回的語句使用創建表格命令,複製語句並替換創建表格創建外部表格

  • 外部確保Spark SQL不會刪除您的數據,如果您刪除表。

  • 您可以省略TBLPROPERTIES字段。

下降表格wikicc
創建外部表格wikicc國家字符串int格式SERDE“org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe”存儲作為INPUTFORMAT“org.apache.hadoop.mapred.TextInputFormat”OUTPUTFORMAT“org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat”位置' < path-to-table >”

步驟3:對數據發出SQL命令

選擇wikicc