pyspark.pandas.DataFrame.corr¶

DataFrame。 相關係數 ( 方法:str=皮爾森的 )→pyspark.pandas.frame.DataFrame¶

計算兩兩相關的列,不包括NA / null值。

參數

方法 {“皮爾森”、“槍兵”}

返回

另請參閱

筆記

有行為差異pandas-on-Spark和熊貓。

例子

           > > >df=ps。DataFrame(((2,3),(比上年,6),(6,比上年),(2,1。)),…列=(“狗”,“貓”])> > >df。相關係數(皮爾森的)狗貓狗1.000000 - -0.851064貓-0.851064 - 1.000000
          

           > > >df。相關係數(“槍兵”)狗貓狗1.000000 - -0.948683貓-0.948683 - 1.000000
          

以前的

pyspark.pandas.DataFrame.clip

下一個

pyspark.pandas.DataFrame.corrwith