使用DBFS根目錄的建議

Databricks使用DBFS根目錄作為目錄默認位置對於一些工作區操作。Databricks建議不要將任何生產數據或敏感信息存儲在DBFS根目錄中。本文主要介紹避免意外暴露DBFS根上的敏感數據的建議。

請注意

Databricks配置一個單獨的私有存儲位置,用於在客戶擁有的雲存儲(稱為內部DBFS)中持久化數據和配置。此位置不會向用戶公開。

教育用戶不要將數據存儲在DBFS根目錄上

因為工作區中的所有用戶都可以訪問DBFS根目錄,所以所有用戶都可以訪問存儲在這裏的任何數據。指導用戶避免使用此位置存儲敏感數據是很重要的。在Databricks上的Hive metastore中,托管表的默認位置是DBFS根目錄;為了防止創建托管表的最終用戶寫入DBFS根目錄,在Hive metastore中創建數據庫時在外部存儲上聲明一個位置。

使用審計日誌來監視活動

您可以將雲審計日誌與工作區審計日誌一起使用,以監視和識別將數據存儲到DBFS根目錄的用戶。