與Databricks Repos集成的GIT集成

了解如何將GIT源控製與Databricks Repos集成。為了支持數據科學和工程代碼開發的最佳實踐,Databricks Repos提供了與GIT提供商的存儲庫級集成。您可以在Databricks筆記本中開發代碼,將其與遠程GIT存儲庫同步,並使用GIT命令進行更新和源控製。

筆記

在Databricks存儲庫中對任意文件的支持現在正在公共預覽中。有關詳細信息,請參閱在Databricks Repo中使用非注釋文件導入Python和R模塊

您可以使用Databricks存儲庫做什麼?

Databricks存儲庫使您可以使用git功能,例如克隆遠程存儲庫,管理分支,推動和拉動更改以及視覺上比較提交時的差異。

Databricks存儲庫還提供了API您可以與CI/CD管道集成。例如,您可以通過編程方式更新Databricks存儲庫,以使其始終具有最新的代碼版本。

Databricks Repos提供了安全功能,例如允許列表控製訪問GIT存儲庫和在源代碼中檢測清晰的文本秘密

什麼時候審核記錄已啟用,當您與Databricks存儲庫交互時,將記錄審核事件。例如,當您創建,更新或刪除數據鏈芯庫時,將記錄一個審核事件,當您列出與工作區關聯的所有Databricks存儲庫時,以及當您同步數據標準返回和GIT遙控器之間的更改時。

有關使用Databricks存儲庫的代碼開發最佳實踐的更多信息,請參見CI/CD工作流與Databricks Repos和GIT集成

支持GIT提供商

Databricks支持這些GIT提供商:

  • github

  • Bitbucket雲

  • GitLab

  • Azure Devops(在中國的Azure地區不可用)

  • AWS CodeCommit

  • github ae

DataBricks Repos還支持BitBucket服務器,GitHub Enterprise Server或GitLab自我管理的訂閱實例集成,如果服務器可訪問Internet。

要與不可訪問的私有Git服務器實例集成,請與您的Databricks代表聯係。

Databricks Runtime 8.4及以上的Databricks Repos中對任意文件的支持。