快速入門:運行並可視化查詢

這篇快速入門教程向您展示了如何查詢一個人的表,以查找被命名的女性的數量瑪麗按出生年份分組,並將結果可視化。

表的列是idfirstNamemiddleName性別生日ssn,工資

本文展示了如何使用Databricks SQL UI和BI工具Power BI和Tableau Online來執行相同的查詢。

需求

您的數據庫管理員必須完成數據庫SQL管理快速入門在您完成以下部分的步驟之前。

警告:如果沒有提供所需的CPU和存儲資源,SQL倉庫將無法啟動。如果資源不足,請聯係管理員增加配額。看到計算引擎API.如果需要,可以更改SQL倉庫的資源。若要審查現有配額並請求增加配額,請參見審查和增加配額.有關工作區成本的信息,請參見每工作空間成本

使用Databricks SQL UI查詢表並創建可視化

使用側邊欄

您可以使用側欄訪問Databricks的所有資產。側邊欄的內容取決於所選角色:數據科學與工程機器學習,或SQL

  • 默認情況下,側邊欄顯示為折疊狀態,隻有圖標可見。將光標移到側邊欄上以展開到完整視圖。

  • 要更改角色,請單擊Databricks logo下麵的圖標磚的標誌,並選擇一個角色。

    改變形象
  • 要固定角色以便在下次登錄時顯示,請單擊銷的角色在角色旁邊。再次單擊它以刪除引腳。

  • 使用菜單選項在工具條底部設置工具條模式為汽車(默認行為),擴大,或崩潰

切換到不同的工作區

如果您可以訪問同一個帳戶中的多個工作空間,那麼您可以在它們之間快速切換。

  1. 單擊Databricks工作空間頂部欄中的工作空間名稱。

  2. 從下拉菜單中選擇一個工作區以切換到它。

步驟1:登錄數據庫數據庫

當你登錄到Databricks SQL時,你的登錄頁麵是這樣的:

用戶登錄頁麵

如果Databricks數據科學與工程或Databricks機器學習環境顯示,使用側邊欄切換到Databricks SQL。

步驟2:查詢people表

管理員快速入門:設置一個查詢表的用戶,管理員創建了一個名為people10.在本節中,您在該表上運行一個查詢,查詢所有名為Mary的人的生日和出生年齡。

  1. 點擊新圖標在側邊欄中選擇查詢

    SQL編輯器將顯示。

  2. 選擇起動器倉庫(或其他所需的SQL倉庫)。

    第一次創建查詢時,可用SQL倉庫的列表將按字母順序顯示。下次創建查詢時,將選擇最後使用的倉庫。

  3. 粘貼在這個選擇查詢指定的女性數量的語句瑪麗

    選擇一年生日作為birthYear作為總計默認的people10m在哪裏firstName“瑪麗”性別“F”集團通過birthYear訂單通過birthYear
  4. 新聞Ctrl / Cmd + Enter或者點擊全部運行(限製1000)

    限製1000默認情況下選擇複選框,以確保查詢最多返回1000行。如果需要更多行,可以取消選中複選框並指定限製條款。查詢結果顯示在“Table”頁簽中。

    查詢結果
  5. 點擊保存保存此查詢。

  6. 保存查詢文本框中,輸入瑪麗並點擊保存

步驟3:創建可視化

  1. 單擊+添加可視化選項卡。

    顯示可視化編輯器。

    可視化編輯器
  2. 將可視化名稱更改為瑪麗的出生一年

  3. 可視化類型下拉,選擇酒吧

  4. X列下拉,驗證birthYear被選中。

  5. Y列下拉,驗證總計被選中。

  6. 單擊X軸選項卡。

  7. 在Name字段中輸入出生一年

  8. 單擊Y軸選項卡。

  9. 在Name字段中輸入數量瑪麗通過出生一年

  10. 點擊保存

    保存的圖表顯示在SQL編輯器中。

    瑪麗SQLA圖表

步驟4:創建一個儀表板

  1. 點擊新圖標在側邊欄中選擇指示板

  2. 輸入作為儀表板名稱。

  3. 點擊保存

  4. 添加下拉列表中,單擊可視化

  5. 在查詢列表中,選擇瑪麗

    添加可視化部件
  6. 點擊添加到儀表板

  7. 點擊做編輯

    完整的儀表板

下一個步驟

  • 查看一些示例儀表板,為豐富的可視化和可用的布局提供了一個起點,通過執行以下操作之一:

    • 點擊查看畫廊在底部指示板頁麵。

    • https:// < databricks-instance > / sql /儀表板/樣品,取代你的< databricks-instance >與磚工作區實例名例如,1234567890123456.7.gcp.www.eheci.com

  • 查詢一個表並創建一個可視化使用常用BI工具

使用連接到Databricks SQL的BI工具查詢表並創建可視化

本節展示了如何收集Databricks SQL信息,如何將Power BI Desktop和Tableau Online連接到Databricks SQL,以及如何在每個BI工具中查詢人員表和可視化數據。

在本節中:

磚的SQL

本節描述如何收集倉庫連接信息並生成一個令牌,您可以使用該令牌對您的工具進行Databricks SQL的身份驗證。

步驟1:獲取SQL倉庫連接詳細信息

  1. 登錄Databricks SQL

  2. 點擊端點圖標SQL倉庫在側邊欄。

  3. 在“倉庫”列表中,鍵入起動器在過濾盒裏。

  4. 單擊起動器倉庫鏈接。

  5. 單擊連接細節選項卡。

    連接細節
  6. 點擊複製圖標複製服務器主機名和HTTP路徑。

步驟2:獲取個人訪問令牌

個人訪問令牌對Databricks SQL進行身份驗證。

  1. 在工作區的頂部欄中單擊您的用戶名並選擇用戶設置從下拉菜單。

  2. 單擊個人訪問令牌選項卡。

  3. 點擊+生成新令牌

  4. 可選地輸入注釋並修改令牌生存期。

  5. 點擊生成

  6. 點擊複製圖標複製令牌,單擊好吧

權力BI

步驟1:配置Power BI到Databricks SQL的連接

  1. 選擇獲取數據>更多…> Azure並選擇Azure磚連接器。

    獲取數據列表中的Databricks連接器
  2. 點擊連接

  3. 輸入複製進來的服務器主機名和HTTP路徑步驟1:獲取SQL倉庫連接詳細信息

    Power BI數據源
  4. 點擊好吧

  5. 在身份驗證提示時,選擇個人訪問令牌選項卡。輸入您複製進來的個人訪問令牌步驟2:獲取個人訪問令牌

  6. 點擊連接

    如果SQL倉庫沒有運行,它將啟動,但可能需要幾分鍾才能變為可用。

  7. 在Power BI導航器中,選擇default.people10m表格

  8. 點擊負載

步驟2:塑造數據

返回姓瑪麗的婦女的記錄,計算每年瑪麗的數量。

  1. 刪除所有列firstName性別,生日

  2. 使用firstName瑪麗而且性別F

  3. 更改的類型生日日期除去除年以外的所有日期成分。

  4. 按年分組,計算每年聖母瑪利亞的數量。

mary Power BI表

步驟3:可視化數據

Marys Power BI圖表

表在線

步驟1:配置從Tableau Online到Databricks SQL的連接

  1. 在Tableau Online中,打開一個工作簿或創建一個新的工作簿。

  2. 選擇Data >新數據源

    Tableau在線數據源
  3. 在Connect to Data對話框中,選擇連接器>磚

    表在線磚
  4. 在Databricks連接對話框中,輸入服務器主機名而且HTTP路徑你複製的步驟1:獲取SQL倉庫連接詳細信息

    表數據源
  5. 驗證使用令牌作為用戶名和令牌步驟2:獲取個人訪問令牌的密碼。

  6. 點擊登錄

    如果SQL倉庫沒有運行,它將啟動,但可能需要幾分鍾才能變為可用。

  7. 在Schema字段中輸入默認的.新聞輸入

  8. 選擇模式下拉,選擇默認的

  9. 在Table字段中輸入people10m.新聞輸入

  10. 拖動people10表到畫布上。

步驟2:塑造數據

返回姓瑪麗的婦女的記錄,計算每年瑪麗的數量。

  1. 刪除所有列firstName性別,生日

  2. 使用firstName瑪麗而且性別F

  3. 更改的類型生日日期除去除年以外的所有日期成分。

  4. 按年分組,計算每年聖母瑪利亞的數量。

瑪麗表的表

步驟3:可視化數據

用柱狀圖可視化:

瑪麗表圖