pyspark.pandas.DataFrame.corrwith

DataFrame。 corrwith ( 其他:聯盟(DataFrame,係列],下降:bool=,方法:str=皮爾森的 )→係列

計算兩兩相關。

行或列之間的兩兩相關計算DataFrame係列或DataFrame的行或列。DataFrames首先沿兩軸對齊前計算的相關性。

參數
其他 DataFrame,係列

對象來計算相關性。

下降 bool,默認的錯誤

從結果丟失指標。

方法 str,默認的皮爾森

相關的方法之一:

  • 皮爾森:標準的相關係數

返回
係列

兩兩相互關係。

另請參閱

DataFrame.corr

計算兩兩相關的列。

例子

> > >df1=psDataFrame({“一個”:【1,5,7,8),“X”:【5,8,4,3),“C”:【10,4,9,3]})> > >df1corrwith(df1[[“X”,“C”]])X 1.0C 1.0一個南dtype: float64
> > >df2=psDataFrame({“一個”:【5,3,6,4),“B”:【11,2,4,3),“C”:【4,3,8,5]})
> > >psoption_context(“compute.ops_on_diff_frames”,真正的):df1corrwith(df2)-0.041703C 0.395437X南B南dtype: float64
> > >psoption_context(“compute.ops_on_diff_frames”,真正的):df2corrwith(df1X)-0.597614B -0.151186C -0.642857dtype: float64