DBeaver與Databricks的集成

請注意

本文將介紹DBeaver, Databricks既不提供也不支持它。要聯係提供商,請參見使用問題頁麵的dbeaver / dbeaver在GitHub回購。

DBeaver是為開發人員、數據庫管理員、數據分析Beplay体育安卓版本師、數據工程師和其他需要使用數據庫的人員提供的本地、多平台數據庫工具。DBeaver支持Databricks以及其他流行的數據庫。

本文描述如何使用本地開發機器安裝、配置和使用免費的開源DBeaver Community Edition (CE)來處理Databricks中的數據庫。

請注意

本文使用macOS進行了測試,磚JDBC驅動程序版本2.6.25,DBeaver CE22.1.0版本。

需求

在安裝DBeaver之前,您的本地開發機器必須滿足以下要求:

  • Linux 64位、macOS或Windows 64位操作係統。(支持32位Linux,不推薦使用)

  • 磚JDBC驅動程序到本地開發機器上,提取DatabricksJDBC42.jar已下載的DatabricksJDBC42——<版本> . zip文件。

你還必須有一個數據庫集群SQL倉庫將DBeaver連接到。

步驟1:安裝DBeaver

下載並安裝DBeaver CE如下:

  • Linux:下載並運行其中一個Linux安裝程序下載在DBeaver網站上。提前而且flatpak這個頁麵上還提供了安裝選項。

  • macOS:使用家釀運行釀造安裝——桶dbeaver-community,或者使用MacPorts運行sudo港口安裝dbeaver-community.macOS安裝程序也可從下載在DBeaver網站上。

  • 窗戶:使用巧克力色運行喬科省安裝dbeaver.Windows安裝程序也可從下載在DBeaver網站上。

步驟2:配置DBeaver的Databricks JDBC Driver

用前麵下載的Databricks JDBC驅動程序的相關信息設置DBeaver。

  1. DBeaver開始。

  2. 如果係統提示您創建一個新數據庫,請單擊沒有

  3. 如果係統提示連接或選擇數據庫,請單擊取消

  4. 點擊數據庫>驅動程序管理器

  5. 驅動程序管理器對話框中,單擊

  6. 創建新司機對話框中,單擊選項卡。

  7. 點擊添加文件

  8. 瀏覽到DatabricksJDBC42.jar文件,然後單擊開放

  9. 點擊找到類

  10. 驅動程序類列表,確認com.databricks.client.jdbc.Driver被選中。

  11. 設置選項卡,司機的名字,輸入

  12. 設置選項卡,類名,輸入com.databricks.client.jdbc.Driver

  13. 點擊好吧

  14. 驅動程序管理器對話框中,單擊關閉

步驟3:連接DBeaver到您的Databricks數據庫

使用DBeaver連接到集群或SQL倉庫,以訪問Databricks工作空間中的數據庫。

  1. 在DBeaver中,單擊數據庫>新建數據庫連接

  2. 連接到數據庫對話框,對所有選項卡上,單擊,然後按下一個

  3. 單擊主要選項卡中輸入一個值JDBC URL字段為您的Databricks資源:

    1. 找到JDBC URL價值JDBC / ODBC選項卡中高級選項您的集群的區域。JDBC URL應該類似於以下示例:

      jdbc//dbc-a1b2345c-d6e7com443/默認的運輸方式httpssl1httpPathsql/protocolv1/o/1234567890123456/1234-567890-reef123AuthMech3.UID令牌鬆材線蟲病= <個人-訪問-令牌>

      重要的

      如果JDBC URL以jdbc:火花:,你必須把它改為jdbc:磚:否則您稍後將會得到一個連接錯誤。

    2. 取代< personal-access-token >與你的個人訪問令牌用於Databricks工作區。

    3. 檢查本地保存密碼

    提示

    如果不想在本地開發機器上存儲個人訪問令牌,請省略UID =令牌;PWD = < personal-access-token >從JDBC URL,並取消勾選本地保存密碼.係統將提示您輸入您的用戶名(這個詞令牌),密碼(您的個人訪問令牌)每次嚐試連接。

    1. 找到JDBC URL價值連接細節選項卡。JDBC URL應該類似於以下示例:

      jdbc//dbc-a1b2345c-d6e7com443/默認的運輸方式httpssl1AuthMech3.httpPath= /sql/1.0/倉庫/a123456bcde7f890

      重要的

      如果JDBC URL以jdbc:火花:,你必須把它改為jdbc:磚:否則您稍後將會得到一個連接錯誤。

    2. 用戶名,輸入單詞令牌

    3. 密碼,輸入您的個人訪問令牌

    4. 檢查本地保存密碼

    提示

    如果不希望在本地開發機器上存儲個人訪問令牌,請離開用戶名而且密碼空白和取消本地保存密碼.係統將提示您輸入您的用戶名(這個詞令牌),密碼(您的個人訪問令牌)每次嚐試連接。

  4. 點擊測試連接

    提示

    在測試連接之前,應該啟動Databricks資源。否則,在資源啟動時,測試可能需要幾分鍾才能完成。

  5. 如果連接成功,則在連接測試對話框中,單擊好吧

  6. 連接到數據庫對話框中,單擊完成

數據庫導航器窗口中,一個顯示條目。更改連接的名稱以使其更容易識別:

  1. 右鍵單擊,然後按編輯連接

  2. 連接配置對話框中,單擊一般

  3. 連接名、替換使用不同的連接名稱。

  4. 點擊好吧

對於希望DBeaver訪問的每個資源,重複此步驟中的說明。

步驟4:使用DBeaver瀏覽數據對象

使用DBeaver訪問Databricks工作空間中的數據對象,如表和表屬性、視圖、索引、數據類型和其他數據對象類型。

  1. 在DBeaver,在數據庫導航器窗口中,右鍵單擊要使用的連接。

  2. 如果連接已啟用,單擊它。(如果連接已禁用,您已連接。)

    提示

    在嚐試連接到資源之前,應該啟動資源。否則,在資源啟動時,連接可能需要幾分鍾才能完成。

  3. 展開您剛剛連接到的連接。

  4. 展開和瀏覽可用的數據對象。雙擊數據對象可獲得關於它的更多信息。

重複此步驟中的說明以訪問其他數據對象。

步驟5:使用DBeaver運行SQL語句

使用DBeaver加載樣例鑽石表的樣本數據集默認的數據庫,然後查詢表。有關更多信息,請參見創建一個表.如果不想加載樣例表,請跳到下一個步驟

  1. 在DBeaver,在數據庫導航器窗口中,右鍵單擊要使用的連接。

  2. 如果連接已啟用,單擊它。(如果連接已禁用,您已連接。)

    提示

    在嚐試連接到資源之前,應該啟動資源。否則,在資源啟動時,連接可能需要幾分鍾才能完成。

  3. 點擊SQL編輯器>新建SQL腳本

  4. (連接名)Script-1選項卡,輸入這些SQL語句,將刪除一個名為鑽石,然後創建一個名為鑽石根據Databricks文件係統(DBFS)掛載點中的CSV文件內容:

    下降表格如果存在鑽石創建表格鑽石使用CSV選項路徑“/ databricks-datasets / Rdatasets /數據- 001 / csv / ggplot2 / diamonds.csv”“真正的”);
  5. 點擊SQL編輯器>執行SQL語句

  6. 數據庫導航器窗口,擴大默認的數據庫,然後單擊刷新

  7. 擴大,然後雙擊鑽石

  8. 鑽石選項卡上,單擊數據選項卡查看表的數據。

刪除鑽石表:

  1. 點擊SQL編輯器>新建SQL腳本

  2. (連接名)腳本2選項卡,輸入此SQL語句,該語句將刪除鑽石表格

    下降表格如果存在鑽石
  3. SQL編輯器”菜單上,單擊“執行SQL語句

  4. 數據庫導航器窗口中,右鍵單擊默認的數據庫,然後單擊刷新.的鑽石表從表列表中消失。

下一個步驟