可視化

Databricks筆記本有內置的圖表和可視化支持。方法時,可以使用本節中描述的可視化顯示命令以記事本單元格中的pandas或Apache Spark DataFrame形式查看數據表結果。

有關遺留Databricks可視化的信息,請參見傳統的可視化

創建一個新的可視化

要從單元格結果創建可視化,notebook單元格必須使用顯示命令顯示結果。點擊+並選擇可視化菜單.出現可視化編輯器。

新的可視化菜單
  1. 可視化類型下拉菜單,選擇類型。

    可視化編輯器
  2. 選擇要顯示在可視化中的數據。可用的字段取決於所選的類型。

  3. 點擊保存

可視化工具

如果您將鼠標懸停在可視化編輯器中圖表的右上方,將出現一個Plotly工具欄,您可以在其中執行選擇、縮放和平移等操作。

筆記本可視化編輯器工具欄

如果你將鼠標懸停在筆記本的圖表右上角,就會出現一個工具子集:

筆記本圖表工具欄

創建一個新的數據概要文件

請注意

支持Databricks Runtime 9.1 LTS及以上版本。

數據配置文件以表格和圖形格式顯示Apache Spark DataFrame、pandas DataFrame或SQL表的彙總統計信息。要從結果單元格創建數據配置文件,請單擊+並選擇來自菜單的數據配置文件

數據配置文件新的可視化菜單

Databricks計算並顯示彙總統計信息。

數據概要
  • 數字和類別的特征顯示在單獨的表中。

  • 在選項卡的頂部,您可以對功能進行排序或搜索。

  • 在圖表列的頂部,您可以選擇顯示直方圖(標準)或分位數。

  • 檢查擴大放大圖表。

  • 檢查日誌以對數刻度顯示圖表。

  • 您可以將光標懸停在圖表上以獲取更詳細的信息,例如直方圖列的邊界和其中的行數,或者分位數值。

您還可以通過編程方式生成數據概要文件;看到總結命令(dbutils.data.summarize)

使用可視化和數據配置文件

請注意

數據配置文件在Databricks Runtime 9.1 LTS及以上版本中可用。

重命名、複製或刪除可視化或數據配置文件

要重命名、複製或刪除可視化或數據配置文件,請單擊選項卡名稱右側的三個垂直點。

筆記本可視化下拉菜單

您還可以通過直接單擊它並在適當的位置編輯名稱來更改名稱。

編輯一個可視化

點擊可視化編輯按鈕在可視化下麵打開可視化編輯器。完成更改後,單擊保存

編輯顏色

您可以在創建可視化或編輯可視化時自定義可視化的顏色。

  1. 創建或編輯可視化。

  2. 點擊顏色

  3. 要修改顏色,單擊正方形並通過以下操作之一選擇新顏色:

    • 在顏色選擇器中單擊它。

    • 輸入十六進製值。

  4. 單擊顏色選擇器以外的任何位置以關閉它並保存更改。

暫時隱藏或顯示一係列

要在可視化中隱藏係列,請單擊圖例中的係列。要再次顯示該係列,請在圖例中再次單擊它。

若要僅顯示單個係列,請雙擊圖例中的係列。要顯示其他係列,請單擊每個係列。

下載一個可視化

要下載。png格式的可視化圖像,請單擊相機圖標攝像頭圖標在筆記本單元格中或在可視化編輯器中。

  • 在筆記本單元格中,當您將光標移到單元格上時,相機圖標將出現在右上方。

    筆記本電池內置攝像頭
  • 在可視化編輯器中,當您將光標移到圖表上時,將出現相機圖標。看到可視化工具

    可視化編輯器中的攝像頭

向儀表板添加可視化或數據配置文件

  1. 單擊選項卡名稱右側的三個垂直點。

    添加到儀表板
  2. 選擇添加到儀表板.將出現可用儀表板視圖的列表,以及一個菜單選項添加到新儀表板

  3. 選擇儀表板或選擇添加到新儀表板.出現指示板,包括新添加的可視化或數據配置文件。