DBeaver與Databricks的集成
請注意
本文將介紹DBeaver, Databricks既不提供也不支持它。要聯係提供商,請參見使用問題頁麵的dbeaver / dbeaver在GitHub回購。
DBeaver是為開發人員、數據庫管理員、數據分析Beplay体育安卓版本師、數據工程師和其他需要使用數據庫的人員提供的本地、多平台數據庫工具。DBeaver支持Databricks以及其他流行的數據庫。
本文描述如何使用本地開發機器安裝、配置和使用免費的開源DBeaver Community Edition (CE)來處理Databricks中的數據庫。
請注意
本文使用macOS進行了測試,磚JDBC驅動程序版本2.6.25,DBeaver CE22.1.0版本。
需求
在安裝DBeaver之前,您的本地開發機器必須滿足以下要求:
Linux 64位、macOS或Windows 64位操作係統。(支持32位Linux,不推薦使用)
的磚JDBC驅動程序到本地開發機器上,提取
DatabricksJDBC42.jar
已下載的DatabricksJDBC42——<版本> . zip
文件。
你還必須有一個數據庫集群或SQL倉庫將DBeaver連接到。
步驟1:安裝DBeaver
下載並安裝DBeaver CE如下:
步驟2:配置DBeaver的Databricks JDBC Driver
用前麵下載的Databricks JDBC驅動程序的相關信息設置DBeaver。
DBeaver開始。
如果係統提示您創建一個新數據庫,請單擊沒有.
如果係統提示連接或選擇數據庫,請單擊取消.
點擊數據庫>驅動程序管理器.
在驅動程序管理器對話框中,單擊新.
在創建新司機對話框中,單擊庫選項卡。
點擊添加文件.
瀏覽到
DatabricksJDBC42.jar
文件,然後單擊開放.點擊找到類.
在驅動程序類列表,確認com.databricks.client.jdbc.Driver被選中。
在設置選項卡,司機的名字,輸入
磚
.在設置選項卡,類名,輸入
com.databricks.client.jdbc.Driver
.點擊好吧.
在驅動程序管理器對話框中,單擊關閉.
步驟3:連接DBeaver到您的Databricks數據庫
使用DBeaver連接到集群或SQL倉庫,以訪問Databricks工作空間中的數據庫。
在DBeaver中,單擊數據庫>新建數據庫連接.
在連接到數據庫對話框,對所有選項卡上,單擊磚,然後按下一個.
單擊主要選項卡中輸入一個值JDBC URL字段為您的Databricks資源:
找到JDBC URL價值JDBC / ODBC選項卡中高級選項您的集群的區域。JDBC URL應該類似於以下示例:
jdbc:磚://dbc-a1b2345c-d6e7.雲.磚.com:443/默認的;運輸方式=http;ssl=1;httpPath=sql/protocolv1/o/1234567890123456/1234-567890-reef123;AuthMech=3.;UID=令牌;鬆材線蟲病= <個人-訪問-令牌>
重要的
如果JDBC URL以
jdbc:火花:
,你必須把它改為jdbc:磚:
否則您稍後將會得到一個連接錯誤。取代
< personal-access-token >
與你的個人訪問令牌用於Databricks工作區。檢查本地保存密碼.
提示
如果不想在本地開發機器上存儲個人訪問令牌,請省略
UID =令牌;PWD = < personal-access-token >
從JDBC URL,並取消勾選本地保存密碼.係統將提示您輸入您的用戶名(這個詞令牌
),密碼(您的個人訪問令牌)每次嚐試連接。找到JDBC URL價值連接細節選項卡。JDBC URL應該類似於以下示例:
jdbc:磚://dbc-a1b2345c-d6e7.雲.磚.com:443/默認的;運輸方式=http;ssl=1;AuthMech=3.;httpPath= /sql/1.0/倉庫/a123456bcde7f890;
重要的
如果JDBC URL以
jdbc:火花:
,你必須把它改為jdbc:磚:
否則您稍後將會得到一個連接錯誤。為用戶名,輸入單詞
令牌
.為密碼,輸入您的個人訪問令牌.
檢查本地保存密碼.
提示
如果不希望在本地開發機器上存儲個人訪問令牌,請離開用戶名而且密碼空白和取消本地保存密碼.係統將提示您輸入您的用戶名(這個詞
令牌
),密碼(您的個人訪問令牌)每次嚐試連接。點擊測試連接.
提示
在測試連接之前,應該啟動Databricks資源。否則,在資源啟動時,測試可能需要幾分鍾才能完成。
如果連接成功,則在連接測試對話框中,單擊好吧.
在連接到數據庫對話框中,單擊完成.
在數據庫導航器窗口中,一個磚顯示條目。更改連接的名稱以使其更容易識別:
右鍵單擊磚,然後按編輯連接.
在連接配置對話框中,單擊一般.
為連接名、替換
磚
使用不同的連接名稱。點擊好吧.
對於希望DBeaver訪問的每個資源,重複此步驟中的說明。
步驟4:使用DBeaver瀏覽數據對象
使用DBeaver訪問Databricks工作空間中的數據對象,如表和表屬性、視圖、索引、數據類型和其他數據對象類型。
在DBeaver,在數據庫導航器窗口中,右鍵單擊要使用的連接。
如果連接已啟用,單擊它。(如果連接已禁用,您已連接。)
提示
在嚐試連接到資源之前,應該啟動資源。否則,在資源啟動時,連接可能需要幾分鍾才能完成。
展開您剛剛連接到的連接。
展開和瀏覽可用的數據對象。雙擊數據對象可獲得關於它的更多信息。
重複此步驟中的說明以訪問其他數據對象。
步驟5:使用DBeaver運行SQL語句
使用DBeaver加載樣例鑽石
表的樣本數據集到默認的
數據庫,然後查詢表。有關更多信息,請參見創建一個表.如果不想加載樣例表,請跳到下一個步驟.
在DBeaver,在數據庫導航器窗口中,右鍵單擊要使用的連接。
如果連接已啟用,單擊它。(如果連接已禁用,您已連接。)
提示
在嚐試連接到資源之前,應該啟動資源。否則,在資源啟動時,連接可能需要幾分鍾才能完成。
點擊SQL編輯器>新建SQL腳本.
在(連接名)Script-1選項卡,輸入這些SQL語句,將刪除一個名為
鑽石
,然後創建一個名為鑽石
根據Databricks文件係統(DBFS)掛載點中的CSV文件內容:下降表格如果存在鑽石;創建表格鑽石使用CSV選項(路徑“/ databricks-datasets / Rdatasets /數據- 001 / csv / ggplot2 / diamonds.csv”,頭“真正的”);
點擊SQL編輯器>執行SQL語句.
在數據庫導航器窗口,擴大默認的數據庫,然後單擊刷新.
擴大表,然後雙擊鑽石.
在鑽石選項卡上,單擊數據選項卡查看表的數據。
刪除鑽石
表:
點擊SQL編輯器>新建SQL腳本.
在(連接名)腳本2選項卡,輸入此SQL語句,該語句將刪除
鑽石
表格下降表格如果存在鑽石;
在SQL編輯器”菜單上,單擊“執行SQL語句.
在數據庫導航器窗口中,右鍵單擊默認的數據庫,然後單擊刷新.的
鑽石
表從表列表中消失。