registerTempTable ()
registerTempTable()創建一個內存中的表的作用範圍是整個集群的創建。數據存儲使用蜂巢的高度優化,內存中的柱狀格式。
這是重要的儀表板儀表板(即運行在不同的集群。單一儀表板集群)將無法獲得臨時表登記在另一個集群。
重新注冊一個臨時表的同名(使用覆蓋= true),但與新數據導致原子內存指針切換新數據是完美地更新和立即accessble查詢(即。從儀表板)。
saveAsTable ()
saveAsTable()創建了一個永久性的,物理表存儲在S3使用鑲花格式。這張桌子都可以訪問所有集群包括儀表板集群。表元數據包括文件(s)的位置存儲在蜂房metastore。
重新創建一個永久的同名的表(使用覆蓋= true),但新數據導致要刪除舊數據,新的數據保存在相同的底層文件S3。這可能會導致時刻數據不可用S3的最終一致性模型。有持續改進以減少停機時間,然而。
我引發的極端的初學者,所以我可能缺少大的東西。使用saveAsTable(),我如何指定在哪裏存儲在S3中鋪文件(s) ?SaveAsTable隻接受一個表名,並將數據保存在/ user /蜂巢dbfs在這個位置/倉庫/。我已經安裝與dbutils.fs S3。掛載在/ mnt /湖。謝謝