在DBFS中探索和創建表
重要的
此文檔已退役,可能無法更新。本內容中提及的產品、服務或技術已不再受支持。看到使用添加數據UI加載數據,上傳數據到Databricks,使用數據資源管理器發現和管理數據.
訪問遺留DBFS文件上傳和表創建UI添加數據界麵.點擊新建> Data > DBFS.
您也可以從筆記本中通過單擊進入UIFile >上傳數據.
Databricks推薦使用數據瀏覽,以改善查看數據對象和管理acl的體驗上傳數據界麵可以很容易地將小文件帶入三角洲湖。
請注意
本文中描述的某些元素的可用性因工作空間配置而異。聯係您的工作空間管理員或Databricks代表。
導入數據
如果在本地機器上有想要用Databricks分析的小數據文件,可以將它們導入到DBFS使用用戶界麵。
請注意
工作區管理員可以禁用此功能。有關更多信息,請參見管理數據上傳.
使用這些方法導入到DBFS的文件存儲在FileStore.
創建表
您可以通過單擊啟動DBFS創建表UI新的邊欄中DBFS按鈕。添加數據界麵.中的文件填充表DBFS或者上傳文件。
對於UI,您隻能創建外部表.
選擇一個數據源,並按照相應部分中的步驟配置表。
如果Databricks工作區管理員有禁用了上傳文件選項,你沒有上傳文件的選項;您可以使用其他數據源之一創建表。
文件上傳說明
將文件拖到文件或者點擊Dropzone來瀏覽和選擇文件。上傳後,將顯示每個文件的路徑。路徑是這樣的
/ FileStore /表/ <文件名> - <整數>。<文件類型>
.您可以在筆記本中使用此路徑讀取數據。點擊用UI創建表.
在“集群”下拉列表中選擇集群。
DBFS使用說明
選擇一個文件。
點擊用UI創建表.
在“集群”下拉列表中選擇集群。
點擊預覽表查看表格。
在表名字段,可選地覆蓋默認表名。表名隻能包含小寫字母數字字符和下劃線,且必須以小寫字母或下劃線開頭。
在在數據庫中創建字段,可選地覆蓋選定的
默認的
數據庫。在文件類型字段,可選地重寫推斷的文件類型。
如果文件類型為CSV:
在列分隔符字段時,選擇是否重寫推斷的分隔符。
指示是否使用第一行作為列標題。
指示是否推斷模式。
如果文件類型為JSON,則說明文件是否為多行文件。
點擊創建表.
查看數據庫和表
請注意
工作區與數據瀏覽啟用後不能訪問下麵描述的遺留行為。
點擊數據在側欄中。Databricks選擇您可以訪問的正在運行的集群。數據庫文件夾顯示具有默認的
選擇數據庫。目錄中的表列表默認的
數據庫。
您可以從數據庫菜單更改集群,創建表用戶界麵,或視圖表用戶界麵.例如,在Databases菜單中:
單擊數據庫文件夾頂部的向下箭頭。
選擇集群。