pyspark.sql.DataFrame.explain

DataFrame。 解釋 ( 擴展:聯盟(bool, str,沒有)=沒有一個,模式:可選(str]=沒有一個 )→沒有

打印到控製台(邏輯和物理)計劃用於調試目的。

參數
擴展 bool,可選

默認的。如果,隻打印物理計劃。當沒有指定這是一個字符串模式,它是指定的模式。

模式 str,可選

指定計劃的預期輸出格式。

  • 簡單的:隻印刷一個物理的計劃。

  • 擴展:打印邏輯和物理的計劃。

  • codegen:打印物理規劃和生成的代碼,如果他們是可用的。

  • 成本:打印一個合乎邏輯的計劃和統計,如果他們是可用的。

  • 格式化解釋輸出分割成兩個部分:一個具體的計劃大綱和節點的細節。

    添加可選參數模式指定計劃的預期輸出格式。

例子

> > >df解釋()= = = =物理計劃*(1)掃描ExistingRDD(# 0歲名字# 1)
> > >df解釋(真正的)= = = =解析邏輯計劃= = = =邏輯分析計劃= = = =邏輯優化計劃= = = =物理計劃
> > >df解釋(模式=“格式化”)= = = =物理計劃*掃描ExistingRDD (1)(1)掃描ExistingRDD codegen id: [1]輸出[2]:[# 0歲名字# 1)
> > >df解釋(“成本”)= = = =邏輯優化計劃統計…