配置筆記本結果存儲位置

您的組織的隱私需求可能需要存儲所有互動筆記本的結果GCS鬥係統數據雲賬戶,而不是Databricks-managed控製平麵默認一些筆記本命令的結果存儲位置。

筆記本命令輸出存儲不同取決於你如何運行筆記本。

默認情況下,當您運行一個筆記本交互式地點擊運行在筆記本上:

  • 如果結果是小,它們存儲在數據磚控製飛機,隨著筆記本電腦的命令內容和元數據。

  • 更大的結果存儲在工作區中GCS鬥係統數據雲在你的穀歌賬戶。磚自動創建的GCS鬥係統數據。磚使用這個存儲區域的空間係統數據和您的工作區DBFS根。筆記本的結果存儲在工作區係統數據存儲,用戶無法訪問。

  • 情節的圖片和其他總是分別存儲在二進製對象FileStore區域的DBFS根

當您運行一個筆記本,一份工作,通過調度或通過點擊現在運行在工作頁麵,所有的結果都存儲在工作區中GCS鬥係統數據在您的帳戶。

您可以配置您的工作區所有互動筆記本結果存儲在雲賬戶,不管結果的大小。

為互動的筆記本配置存儲位置的結果

您可以配置您的工作區將所有互動筆記本結果存儲在你的穀歌雲賬戶,而不是控製飛機。您可以啟用這個特性使用管理員設置頁麵REST API。這個配置在筆記本電腦上運行沒有影響工作,其結果已經默認雲存儲在你的穀歌賬戶。

記住以下幾點:

  • 修改這個配置是有效的新結果。現有筆記本結果不感動。

  • 一些關於結果的元數據,如表列名,繼續被存儲在控製飛機。

  • 增加了存儲成本可能發生在你的雲提供商。

  • 增加網絡和IO延遲閱讀和寫作時可能發生的結果。

所有筆記本結果存儲在您的帳戶使用管理設置頁麵

作為一個工作空間管理員:

  1. 管理員設置頁麵

  2. 單擊工作空間設置選項卡。

  3. 先進的部分,單擊交互式筆記本結果存儲在客戶帳戶切換。

  4. 點擊確認

所有筆記本結果存儲在您的帳戶使用REST API

配置您的工作區將所有筆記本結果存儲在你的穀歌雲賬戶使用REST API:

  • 你一定是一個工作區管理員。

  • 你需要一個個人訪問令牌。下麵說明假設您已經配置了一個. netrc與你的個人文件訪問令牌,這樣您可以使用- n選項旋度命令。有關詳細信息,請參閱上麵的文章引用。

獲取當前的設置、調用得到/ workspace-conf端點和設置storeInteractiveNotebookResultsInCustomerAccount:

curl - n -請求\“https:// < databricks-instance > / api / 2.0 / workspace-conf ?鍵= storeInteractiveNotebookResultsInCustomerAccount '

讓您的工作區互動筆記本結果存儲在你的穀歌雲賬戶,調用補丁/ workspace-conf端點和設置storeInteractiveNotebookResultsInCustomerAccount真正的在請求主體:

curl - n -請求補丁\“https:// < databricks-instance > / api / 2.0 / workspace-conf '\——頭“內容類型:文本/普通”\——data-raw”{“storeInteractiveNotebookResultsInCustomerAccount”:“真正的”}'

禁用功能,設置相同的標誌:

curl - n -請求補丁\“https:// < databricks-instance > / api / 2.0 / workspace-conf '\——頭“內容類型:文本/普通”\——data-raw”{“storeInteractiveNotebookResultsInCustomerAccount”:“假”}'