pyspark.sql.DataFrame.explain¶
-
DataFrame。
解釋
( 擴展:聯盟(bool, str,沒有)=沒有一個,模式:可選(str]=沒有一個 )→沒有¶ -
打印到控製台(邏輯和物理)計劃用於調試目的。
- 參數
-
- 擴展 bool,可選
-
默認的
假
。如果假
,隻打印物理計劃。當沒有指定這是一個字符串模式
,它是指定的模式。 - 模式 str,可選
-
指定計劃的預期輸出格式。
簡單的
:隻印刷一個物理的計劃。擴展
:打印邏輯和物理的計劃。codegen
:打印物理規劃和生成的代碼,如果他們是可用的。成本
:打印一個合乎邏輯的計劃和統計,如果他們是可用的。格式化
解釋輸出分割成兩個部分:一個具體的計劃大綱和節點的細節。添加可選參數模式指定計劃的預期輸出格式。
例子
> > >df。解釋()= = = =物理計劃*(1)掃描ExistingRDD(# 0歲名字# 1)
> > >df。解釋(真正的)= = = =解析邏輯計劃…= = = =邏輯分析計劃…= = = =邏輯優化計劃…= = = =物理計劃…
> > >df。解釋(模式=“格式化”)= = = =物理計劃*掃描ExistingRDD (1)(1)掃描ExistingRDD codegen id: [1]輸出[2]:[# 0歲名字# 1)…
> > >df。解釋(“成本”)= = = =邏輯優化計劃統計……