Git與Databricks Repos集成

學習如何將Git源代碼控製與Databricks Repos集成。為了支持數據科學和工程代碼開發的最佳實踐,Databricks Repos提供了與Git提供者的存儲庫級集成。您可以在Databricks筆記本中開發代碼,將其與遠程Git存儲庫同步,並使用Git命令進行更新和源代碼控製。

請注意

支持任意文件在Databricks回購現在在公共預覽。有關詳細信息,請參見處理UI中的文件導入Python和R模塊

你能用Databricks Repos做什麼?

Databricks Repos通過與Git提供商集成,為數據和AI項目提供源代碼控製。

在Databricks Repos中,你可以使用Git功能:

  • 克隆、推入和從遠程Git存儲庫提取。

  • 為開發工作創建和管理分支。

  • 創建筆記本,並編輯筆記本和其他文件。

  • 提交時視覺上比較差異。

有關詳細說明,請參見在Databricks Repos中使用筆記本和項目文件

對於其他任務,在Git提供程序中工作:

  • 創建一個拉請求。

  • 解決合並衝突。

  • 合並或刪除分支。

  • 變基的一個分支。

Databricks Repos也有一個API可以集成到CI/CD管道中。例如,您可以通過編程方式更新Databricks回購,使其始終具有最新的代碼版本。

有關使用Databricks Repos進行代碼開發的最佳實踐的信息,請參見CI/CD工作流與Databricks Repos和Git集成

安全和審計日誌記錄

Databricks Repos提供安全特性,例如允許列表控製對Git存儲庫的訪問檢測源代碼中的明文秘密

審計日誌記錄,則在與Databricks回購交互時記錄審計事件。例如,當您創建、更新或刪除Databricks回購時,當您列出與工作區關聯的所有Databricks回購時,以及當您同步Databricks回購與遠程Git回購之間的更改時,會記錄審計事件。

Git支持提供商

Databricks支持以下Git提供程序:

  • GitHub

  • Bitbucket都雲

  • GitLab

  • Azure DevOps(在Azure中國地區不可用)

  • AWS CodeCommit

  • GitHub AE

Databricks Repos還支持Bitbucket服務器,GitHub企業服務器,或GitLab自管理訂閱實例集成,如果服務器是互聯網可訪問的。

要與不能通過internet訪問的私有Git服務器實例集成,請與您的Databricks代表聯係。

Databricks Repos中對任意文件的支持在Databricks Runtime 8.4及以上版本中可用。