建立Databricks回購

了解如何設置Databricks Repos進行版本控製。設置好Databricks Repos之後,就可以使用它執行常見的Git操作,比如克隆、簽出、提交、推送、拉出和分支管理。在Databricks中使用筆記本和文件進行開發時,您還可以看到更改的差異。

配置用戶設置

Databricks Repos使用個人訪問令牌(PAT)或等效的憑據對您的Git提供程序進行身份驗證,以執行諸如克隆、推、拉等操作。要使用Repos,首先需要將Git PAT和Git提供程序用戶名添加到Databricks。看到獲取一個Git訪問令牌並連接一個遠程回購到Databricks

您可以克隆公共遠程存儲庫,而不需要Git憑證(個人訪問令牌和用戶名)。要修改公共遠程存儲庫,或克隆或修改私有遠程存儲庫,您必須擁有Git提供者用戶名和個人訪問令牌,對遠程存儲庫具有讀寫權限。

添加Git憑據到數據庫

  1. 點擊用戶設置圖標設置在屏幕的右上角,然後選擇用戶設置

  2. 單擊Git集成選項卡。

  3. 如果您以前已輸入憑據,請單擊改變設置按鈕。

  4. 在Git提供程序下拉菜單中,選擇提供程序名稱。

  5. 從Git提供者獲取個人訪問令牌(PAT)或其他憑證。有關詳細信息,請參見獲取一個Git訪問令牌並連接一個遠程回購到Databricks

    重要的

    Databricks建議您為所有個人訪問令牌設置一個過期日期。

  1. 對於Azure DevOps, Git集成不支持Azure Active Directory令牌。您必須使用Azure DevOps個人訪問令牌。

  2. 如果您的組織在GitHub中啟用了SAML SSO,請確保您已經啟用了為SSO授權您的個人訪問令牌

  1. 將Git提供程序PAT令牌粘貼到令牌字段。

  2. 輸入您的用戶名Git供應商用戶名字段並單擊保存

還可以將Git PAT令牌和用戶名保存到數據庫磚回購的API

Databricks Repos和Git提供程序之間的網絡連接

Databricks Repos需要連接到Git提供程序的網絡才能正常工作。通常,這是通過互聯網和工作的開箱即用。但是,您可能在Git提供程序上設置了額外的限製來控製訪問。例如,您可能有一個適當的IP允許列表,或者您可能托管自己的私有Git服務器——通過諸如GitHub Enterprise(GHE)、Bitbucket Server(BBS)或Gitlab self -managed等服務——而您的Git服務器可能無法通過internet訪問。

請注意

  • 如果你的Git服務器可以上網,但有一個IP允許列表,例如,GitHub允許列表您必須添加數據庫控製平麵NAT IPs到Git服務器的IP允許列表。使用Databricks工作空間所在區域的IP。

  • 如果您正在私人托管一個Git服務器,請與您的Databricks代表聯係,以獲取登錄指示。

Databricks Repos的安全功能

Databricks Repos具有幾個安全特性。以下部分將引導您了解它們的設置和使用:

  • 使用加密的Git憑證。

  • 一個允許列表

  • 工作空間的訪問控製

  • 審計日誌記錄

  • 秘密檢測

自帶密鑰:加密Git憑證

您可以使用AWS密鑰管理服務加密Git個人訪問令牌(PAT)或其他Git憑據。使用加密服務中的密鑰被稱為客戶管理密鑰(CMK)或自帶密鑰(BYOK)。

有關更多信息,請參見被管理服務的客戶管理鍵

限製使用允許列表中的url

管理員可以限製用戶可以克隆、提交和推送到哪些遠程存儲庫。這有助於防止代碼泄露,例如,如果您打開了允許列表限製,用戶就不能將代碼推入任意存儲庫。通過將克隆操作限製在允許的存儲庫列表中,還可以防止用戶使用未經許可的代碼。

設置一個允許列表:

  1. 管理控製台

  2. 單擊工作空間設置選項卡。

  3. 回購部分,從中選擇一個選項Repos Git允許列表

    • 禁用(沒有限製):沒有對允許列表進行檢查。

    • 限製克隆、提交和推送到允許的Git存儲庫:僅允許列表中的存儲庫url進行克隆、提交和推送操作。

    • 隻將提交和推送限製在允許的Git存儲庫中:僅對允許列表中的存儲庫url允許提交和推送操作。克隆和拉操作不受限製。

  4. 在田野旁邊Repos Git URL允許列表:空列表,輸入以逗號分隔的URL前綴列表。

  5. 點擊保存

若要允許訪問所有存儲庫,請選擇禁用(沒有限製)

請注意

  • 保存的列表將覆蓋已保存的URL前綴集。

  • 更改生效可能需要15分鍾。

在工作區中控製對Repo的訪問

為Repo設置權限以控製訪問。回購的權限適用於該回購中的所有內容。菜單選項可以管理可以編輯可以運行而且可以查看

選擇Permissions以控製對回購的訪問。

當你創建回購時,你有可以管理許可。這允許您修改Repo中的內容、執行Git操作或修改遠程存儲庫。用戶應該在自己獨立的Repo中進行開發,並通過Git分支和PRs在共享代碼庫中協作。因此,您不應該給其他用戶可以編輯可以管理獲取您的開發回購。

審計日誌記錄

審計日誌記錄,則在與Databricks回購交互時記錄審計事件。例如,當您創建、更新或刪除Databricks回購時,當您列出與工作區關聯的所有Databricks回購時,以及當您同步Databricks回購與遠程Git回購之間的更改時,會記錄審計事件。

秘密檢測

Databricks Repos掃描代碼以前綴開頭的接入鍵idAKIA並在提交前警告用戶。