與Databricks Repos集成的GIT集成
了解如何將GIT源控製與Databricks Repos集成。為了支持數據科學和工程代碼開發的最佳實踐,Databricks Repos提供了與GIT提供商的存儲庫級集成。您可以在Databricks筆記本中開發代碼,將其與遠程GIT存儲庫同步,並使用GIT命令進行更新和源控製。
筆記
在Databricks存儲庫中對任意文件的支持現在正在公共預覽中。有關詳細信息,請參閱在Databricks Repo中使用非注釋文件和導入Python和R模塊。
您可以使用Databricks存儲庫做什麼?
Databricks存儲庫使您可以使用git功能,例如克隆遠程存儲庫,管理分支,推動和拉動更改以及視覺上比較提交時的差異。
Databricks存儲庫還提供了API您可以與CI/CD管道集成。例如,您可以通過編程方式更新Databricks存儲庫,以使其始終具有最新的代碼版本。
Databricks Repos提供了安全功能,例如允許列表控製訪問GIT存儲庫和在源代碼中檢測清晰的文本秘密。
什麼時候審核記錄已啟用,當您與Databricks存儲庫交互時,將記錄審核事件。例如,當您創建,更新或刪除數據鏈芯庫時,將記錄一個審核事件,當您列出與工作區關聯的所有Databricks存儲庫時,以及當您同步數據標準返回和GIT遙控器之間的更改時。
有關使用Databricks存儲庫的代碼開發最佳實踐的更多信息,請參見CI/CD工作流與Databricks Repos和GIT集成。