配置筆記本結果存儲位置

您的組織的隱私需求可能需要存儲所有互動筆記本的結果根S3存儲桶雲賬戶,而不是Databricks-managed控製平麵默認一些筆記本命令的結果存儲位置。

筆記本命令輸出存儲不同取決於你如何運行筆記本。

默認情況下,當您運行一個筆記本交互式地點擊運行在筆記本上:

  • 如果結果是小,它們存儲在數據磚控製飛機,隨著筆記本電腦的命令內容和元數據。

  • 更大的結果存儲在工作區中根S3存儲桶在AWS帳戶。磚用這個桶工作區係統數據和您的工作區DBFS根。筆記本的結果存儲在工作區中係統數據桶的一部分,由用戶無法訪問。

  • 情節的圖片和其他總是分別存儲在二進製對象FileStore區域的DBFS根

當您運行一個筆記本,一份工作,通過調度或通過點擊現在運行在工作頁麵,所有的結果都存儲在工作區中根S3存儲桶在您的帳戶。

您可以配置您的工作區所有互動筆記本結果存儲在雲賬戶,不管結果的大小。

為互動的筆記本配置存儲位置的結果

您可以配置您的工作區存儲所有交互式筆記本導致AWS帳戶,而不是控製飛機。您可以啟用這個特性使用管理員設置頁麵REST API。這個配置在筆記本電腦上運行沒有影響工作,其結果已經儲存在你的默認AWS帳戶。

記住以下幾點:

  • 修改這個配置是有效的新結果。現有筆記本結果不感動。

  • 一些關於結果的元數據,如表列名,繼續被存儲在控製飛機。

  • 增加了存儲成本可能發生在你的雲提供商。

  • 增加網絡和IO延遲閱讀和寫作時可能發生的結果。

所有筆記本結果存儲在您的帳戶使用管理設置頁麵

作為一個工作空間管理員:

  1. 管理員設置頁麵

  2. 單擊工作空間設置選項卡。

  3. 先進的部分,單擊交互式筆記本結果存儲在客戶帳戶切換。

  4. 點擊確認

所有筆記本結果存儲在您的帳戶使用REST API

配置您的工作區存儲所有筆記本結果使用REST API在AWS帳戶:

  • 你一定是一個工作區管理員。

  • 你需要一個個人訪問令牌。下麵說明假設您已經配置了一個. netrc與你的個人文件訪問令牌,這樣您可以使用- n選項旋度命令。有關詳細信息,請參閱上麵的文章引用。

獲取當前的設置、調用得到/ workspace-conf端點和設置storeInteractiveNotebookResultsInCustomerAccount:

curl - n -請求\“https:// < databricks-instance > / api / 2.0 / workspace-conf ?鍵= storeInteractiveNotebookResultsInCustomerAccount '

讓您的工作區AWS帳戶存儲交互筆記本結果,調用補丁/ workspace-conf端點和設置storeInteractiveNotebookResultsInCustomerAccount真正的在請求主體:

curl - n -請求補丁\“https:// < databricks-instance > / api / 2.0 / workspace-conf '\——頭“內容類型:文本/普通”\——data-raw”{“storeInteractiveNotebookResultsInCustomerAccount”:“真正的”}'

禁用功能,設置相同的標誌:

curl - n -請求補丁\“https:// < databricks-instance > / api / 2.0 / workspace-conf '\——頭“內容類型:文本/普通”\——data-raw”{“storeInteractiveNotebookResultsInCustomerAccount”:“假”}'