如何建立嵌入式Apache Hive轉移瘤

了解如何使用Databricks設置嵌入式Apache Hive metastore。

寫的亞當Pavlacka

最後發布時間:2022年5月16日

您可以設置Databricks集群來使用嵌入的metastore。當您隻需要在集群生命周期內保留表元數據時,可以使用嵌入式metastore。如果重新啟動集群,元數據將丟失。

如果需要在集群重啟後持久化表元數據或其他數據,那麼應該使用默認的轉移存儲或設置一個外部轉移存儲。

本例使用Apache Derby嵌入式轉移庫,這是一個內存中的輕量級數據庫。按照筆記本上的說明安裝轉移瘤。

在將此過程應用到其他集群之前,應該始終在測試集群上執行此過程。

設置一個嵌入式Hive metastore筆記本

檢查嵌入式Hive metastore筆記本