查詢資料
您可以使用查詢資料可視化查詢執行的細節。查詢資料可以幫助你排除在查詢執行的性能瓶頸。例如:
你可以想象每個查詢任務及其相關指標,如時間、處理的行數、行處理和內存消耗。
您可以識別最慢的查詢執行的一部分,乍一看和評估修改查詢的影響。
你會發現和修複在SQL語句中常見的錯誤,如爆炸連接或全表掃描。
重要的
SQL查詢的時間記錄在查詢曆史隻是執行查詢的SQL倉庫實際所花費的時間。它不記錄任何額外開銷準備執行查詢,如內部排隊,或額外的時間相關數據上傳和下載過程。
需求
查看查詢檔案,您必須是查詢的所有者或者你必須有可以管理許可在SQL執行查詢的倉庫。
視圖查詢資料
在運行一個查詢SQL編輯器或一個筆記本,你可以打開查詢配置文件通過單擊底部的時間輸出。
您還可以查看查詢從查詢曆史概要如下:
視圖查詢曆史。
點擊查詢的名稱。
點擊視圖查詢資料。基本查詢指標出現的概述。
請注意
如果查詢配置文件是不可用的顯示,沒有資料可供查詢。查詢配置文件不可用的查詢的運行查詢緩存。規避查詢緩存,使查詢一個微不足道的變化,如改變或刪除
限製
。查看查詢檔案在樹視圖(默認),點擊樹視圖。查看查詢資料圖,點擊圖形視圖。
樹視圖是迅速找到優化問題查詢的性能,如識別時間最長的運營商。
圖形視圖優化可視化是數據流從一個節點到另一個地方。
在樹視圖或圖形視圖中,您可以單擊一個頁麵的頂部的選項卡來查看每個查詢的任務的詳細信息。
時間:所有任務執行時間之和為每個操作。
行:行受影響的數量和規模的每個查詢的任務。
內存:峰值內存消耗的每個查詢的任務。
請注意
執行一些non-Photon操作作為一個群體,分享共同的標準。在這種情況下,所有的子任務都有相同的值作為一個給定的父任務指標。
在樹視圖中,如果一個任務的子任務,你可以點擊>擴大它。在圖形視圖中,單擊一個節點顯示其細節。
每個任務的操作。默認情況下,對於一些操作是隱藏任務和指標。這些操作不太可能導致性能瓶頸的原因。看到所有操作的信息,看到額外的指標,點擊在頁麵的頂部,然後單擊啟用詳細模式。最常見的操作是:
掃描:數據從數據源讀取和輸出行。
加入從多個關係的總和(交叉):行成一個單一的行集。
聯盟從多個關係:行,使用相同的模式連接成一個行集。
洗牌:數據重新分配或重新分區。洗牌操作是昂貴的對資源在集群上因為他們執行人之間移動數據。
散列/排序:行分組的關鍵和評估使用一個聚合函數等
總和
,數
,或馬克斯
在每個組。過濾器:輸入顯示過濾條件,如由一個
在哪裏
條款,並返回的行子集。(重用)交換:一個洗牌或廣播中用於分配數據交換集群節點基於所需的分區。
收集限製:返回的行數是通過使用一個
限製
聲明。把要求和項目:返回的查詢結果是N行。
查看查詢檔案在Apache火花UI,點擊在頁麵的頂部,然後單擊在火花UI。
關閉進口查詢配置文件,點擊X在頁麵的頂部。
更詳細的信息可以在查詢資料,明白了視圖查詢配置文件的詳細信息。
視圖查詢配置文件的詳細信息
查詢配置文件列表查詢的頂級任務在相反的順序,首先列出最後的任務。在左邊,三列顯示任務序列,操作的名稱,圖所選的指標任務。遵循以下步驟,熟悉查詢配置文件的不同部分。
點擊時間每個子任務的持續時間。
點擊行的數量和規模查詢返回的行。
點擊內存看到每個查詢任務所消耗的內存。如果任務的子任務,你可以點擊>每個子任務的詳細信息。
在右側,點擊概述看到查詢的SQL語句,地位,開始和結束時間,持續時間,用戶的查詢,和倉庫查詢被執行死刑的地方。
點擊任務查看任務的詳細信息,如任務的描述和度量任務的持續時間、內存消耗,返回的行數量和規模,血統。
關閉子任務細節,點擊X。
單擊SQL倉庫去倉庫名稱的屬性。
查看查詢檔案在Apache火花UI,點擊在頁麵的頂部,然後單擊在火花UI。
關閉查詢配置文件,點擊X在頁麵的頂部。
導入一個查詢資料
進口為查詢JSON簡介:
視圖查詢曆史。
單擊烤肉菜單在右上角,選擇導入查詢配置文件(JSON)。
在文件瀏覽器中,選擇與你共享的JSON文件並單擊開放。JSON文件上傳和查詢資料顯示。
當你導入一個查詢檔案,動態地加載到瀏覽器會話,不堅持你的工作空間。你需要每次你想把它重新導入。
關閉進口查詢配置文件,點擊X在頁麵的頂部。