pyspark.pandas.Series.corr

係列。 相關係數 ( 其他:pyspark.pandas.series.Series,方法:str=皮爾森的 )→浮動

計算相關其他係列中,除缺失值。

參數
其他 係列
方法 {“皮爾森”、“槍兵”}
  • 皮爾森:標準的相關係數

  • 斯皮爾曼:斯皮爾曼等級相關

返回
相關 浮動

筆記

有行為差異pandas-on-Spark和熊貓。

  • 方法參數隻接受“培生”,“槍兵”

  • 數據不應該包含nan。pandas-on-Spark將返回一個錯誤。

  • pandas-on-Spark不支持以下參數(s)。

    • min_periods的觀點是不支持

例子

> > >df=psDataFrame({“s1 ':(2,比上年,6,2),“s2”:(3,6,比上年,1。]})> > >s1=dfs1> > >s2=dfs2> > >s1相關係數(s2,方法=皮爾森的)-0.851064……
> > >s1相關係數(s2,方法=“槍兵”)-0.948683……