開始
加載和管理數據
處理數據
政府
引用和資源
2023年3月31日更新
給我們反饋
磚使用戶能夠山雲磚文件對象存儲係統(DBFS)來簡化數據訪問模式為用戶不熟悉雲的概念。安裝數據不使用統一目錄,磚建議遷移遠離使用坐騎和管理數據治理和統一目錄。
磚坐騎的工作區和雲之間創建一個鏈接對象存儲,這使您能夠使用熟悉的文件與雲交互對象存儲文件係統路徑相對於磚。通過創建一個本地別名下安裝工作/ mnt目錄存儲以下信息:
/ mnt
雲對象存儲的位置。
司機規範連接到存儲帳戶或容器。
安全憑據訪問所需數據。
的源指定的URI對象存儲(並且可以編碼安全憑證)。的掛載點指定的本地路徑/ mnt目錄中。一些對象存儲資源支持一個可選的encryptionType論點。對於一些訪問模式可以通過額外的配置規範作為一個字典extraConfigs。
源
掛載點
encryptionType
extraConfigs
山(源:str,掛載點:str,encryptionType:可選(str]=”“,extraConfigs:可選(dict(str:str]]=沒有一個)
之前檢查與您的工作區和雲管理員配置或更改數據的增加,如不當配置可以提供無擔保您的工作區中所有用戶的訪問。
請注意
除了本文中描述的方法,您可以自動安裝的桶磚起程拓殖的提供者和databricks_mount。
卸載一個掛載點,使用以下命令:
dbutils。fs。卸載(“/ mnt / < mount-name >”)
警告
為了避免錯誤,從不修改掛載點,其他工作正在閱讀或寫作。修改掛載後,始終運行dbutils.fs.refreshMounts ()在所有其他集群運行任何掛載傳播更新。看到refreshMounts命令(dbutils.fs.refreshMounts)。
dbutils.fs.refreshMounts ()
使用DBFS坐騎,你鬥名稱必須不包含下劃線。寫信給一個gc桶,你必須povide穀歌雲projectId桶。
你必須使用服務帳戶當為您的集群配置安全電子郵件地址。
你可以掛載一桶磚文件係統(DBFS)是什麼?。山是一個指向GCS位置,所以在本地數據不同步。
下例顯示了安裝的基本語法GCS桶:
bucket_name=“my-gcs-bucket”mount_name=“騎”dbutils。fs。山(f“gs: / /{bucket_name}”,f“/ mnt /磚/{mount_name}”,extra_configs={“fs.gs.project.id”:“my-project-id”})
瓦爾bucket_name=“my-gcs-bucket”瓦爾mount_name=“騎”dbutils。fs。山(“gs: / /$ {bucket_name}”,“/ mnt /磚/$ {mount_name}”,extraConfigs=地圖(“fs.gs.project.id”- >“my-project-id”))