pyspark.pandas.DataFrame.corrwith¶
-
DataFrame。
corrwith
( 其他:聯盟(DataFrame,係列],下降:bool=假,方法:str=皮爾森的 )→係列¶ -
計算兩兩相關。
行或列之間的兩兩相關計算DataFrame係列或DataFrame的行或列。DataFrames首先沿兩軸對齊前計算的相關性。
- 參數
-
- 其他 DataFrame,係列
-
對象來計算相關性。
- 下降 bool,默認的錯誤
-
從結果丟失指標。
- 方法 str,默認的皮爾森
-
相關的方法之一:
皮爾森:標準的相關係數
- 返回
-
- 係列
-
兩兩相互關係。
另請參閱
-
DataFrame.corr
-
計算兩兩相關的列。
例子
> > >df1=ps。DataFrame({…“一個”:【1,5,7,8),…“X”:【5,8,4,3),…“C”:【10,4,9,3]})> > >df1。corrwith(df1[[“X”,“C”]])X 1.0C 1.0一個南dtype: float64
> > >df2=ps。DataFrame({…“一個”:【5,3,6,4),…“B”:【11,2,4,3),…“C”:【4,3,8,5]})
> > >與ps。option_context(“compute.ops_on_diff_frames”,真正的):…df1。corrwith(df2)-0.041703C 0.395437X南B南dtype: float64
> > >與ps。option_context(“compute.ops_on_diff_frames”,真正的):…df2。corrwith(df1。X)-0.597614B -0.151186C -0.642857dtype: float64