在DBFS中探索和創建表

重要的

此文檔已退役,可能無法更新。本內容中提及的產品、服務或技術已不再受支持。看到使用添加數據UI加載數據上傳數據到Databricks,使用數據資源管理器發現和管理數據

訪問遺留DBFS文件上傳和表創建UI添加數據界麵.點擊新圖標新建> Data > DBFS

您也可以從筆記本中通過單擊進入UIFile >上傳數據

Databricks推薦使用數據瀏覽,以改善查看數據對象和管理acl的體驗上傳數據界麵可以很容易地將小文件帶入三角洲湖。

請注意

本文中描述的某些元素的可用性因工作空間配置而異。聯係您的工作空間管理員或Databricks代表。

導入數據

如果在本地機器上有想要用Databricks分析的小數據文件,可以將它們導入到DBFS使用用戶界麵。

請注意

工作區管理員可以禁用此功能。有關更多信息,請參見管理數據上傳

使用這些方法導入到DBFS的文件存儲在FileStore

創建表

您可以通過單擊啟動DBFS創建表UI新圖標的邊欄中DBFS按鈕。添加數據界麵.中的文件填充表DBFS或者上傳文件。

對於UI,您隻能創建外部表

  1. 選擇一個數據源,並按照相應部分中的步驟配置表。

    如果Databricks工作區管理員有禁用了上傳文件選項,你沒有上傳文件的選項;您可以使用其他數據源之一創建表。

    文件上傳說明

    1. 將文件拖到文件或者點擊Dropzone來瀏覽和選擇文件。上傳後,將顯示每個文件的路徑。路徑是這樣的/ FileStore /表/ <文件名> - <整數>。<文件類型>.您可以在筆記本中使用此路徑讀取數據。

    2. 點擊用UI創建表

    3. 在“集群”下拉列表中選擇集群。

    DBFS使用說明

    1. 選擇一個文件。

    2. 點擊用UI創建表

    3. 在“集群”下拉列表中選擇集群。

  2. 點擊預覽表查看表格。

  3. 表名字段,可選地覆蓋默認表名。表名隻能包含小寫字母數字字符和下劃線,且必須以小寫字母或下劃線開頭。

  4. 在數據庫中創建字段,可選地覆蓋選定的默認的數據庫。

  5. 文件類型字段,可選地重寫推斷的文件類型。

  6. 如果文件類型為CSV:

    1. 列分隔符字段時,選擇是否重寫推斷的分隔符。

    2. 指示是否使用第一行作為列標題。

    3. 指示是否推斷模式。

  7. 如果文件類型為JSON,則說明文件是否為多行文件。

  8. 點擊創建表

查看數據庫和表

請注意

工作區與數據瀏覽啟用後不能訪問下麵描述的遺留行為。

點擊數據圖標數據在側欄中。Databricks選擇您可以訪問的正在運行的集群。數據庫文件夾顯示具有默認的選擇數據庫。目錄中的表列表默認的數據庫。

創建表列表

您可以從數據庫菜單更改集群,創建表用戶界麵,或視圖表用戶界麵.例如,在Databases菜單中:

  1. 單擊下脫字符號數據庫文件夾頂部的向下箭頭。

  2. 選擇集群。

    選擇集群

查看表詳細信息

表詳細信息視圖顯示表模式和示例數據。

  1. 點擊數據圖標數據在側欄中。

  2. 在“數據庫”文件夾中,單擊一個數據庫。

  3. 在Tables文件夾中,單擊表名。

  4. 在Cluster下拉菜單中,可選地選擇另一個集群來呈現表預覽。

    表的細節

    請注意

    中選擇的集群上運行Spark SQL查詢,以顯示表預覽集群下拉。如果集群上已經運行了工作負載,則加載表預覽可能需要更長的時間。

通過用戶界麵刪除表

  1. 點擊數據圖標數據在側欄中。

  2. 單擊菜單下拉旁邊的表名並選擇刪除