蜂巢表
本文演示如何導入蜂巢表從雲存儲到Databricks使用外部表。
第一步:展示創建表格
聲明
發出一個顯示創建表格<表>
命令在Hive命令行上查看創建表的語句。
蜂巢>顯示創建表格wikicc;好吧創建表格`wikicc`(`國家`字符串,`數`int)行格式SERDE“org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe”存儲作為INPUTFORMAT“org.apache.hadoop.mapred.TextInputFormat”OUTPUTFORMAT“org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat”位置' < path-to-table >”TBLPROPERTIES(“totalSize”=“2335”,numRows的=“240”,“rawDataSize”=“2095”,“COLUMN_STATS_ACCURATE”=“真正的”,“numFiles”=' 1 ',“transient_lastDdlTime”=“1418173653”)
步驟2:簽發創建外部表格
聲明
如果返回的語句使用創建表格
命令,複製語句並替換創建表格
與創建外部表格
.
外部
確保Spark SQL不會刪除您的數據,如果您刪除表。您可以省略
TBLPROPERTIES
字段。
下降表格wikicc
創建外部表格`wikicc`(`國家`字符串,`數`int)行格式SERDE“org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe”存儲作為INPUTFORMAT“org.apache.hadoop.mapred.TextInputFormat”OUTPUTFORMAT“org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat”位置' < path-to-table >”