pyspark.pandas.Series.corr¶
-
係列。
相關係數
( 其他:pyspark.pandas.series.Series,方法:str=皮爾森的 )→浮動¶ -
計算相關其他係列中,除缺失值。
- 參數
-
- 其他 係列
- 方法 {“皮爾森”、“槍兵”}
-
皮爾森:標準的相關係數
斯皮爾曼:斯皮爾曼等級相關
- 返回
-
- 相關 浮動
筆記
有行為差異pandas-on-Spark和熊貓。
的方法參數隻接受“培生”,“槍兵”
數據不應該包含nan。pandas-on-Spark將返回一個錯誤。
pandas-on-Spark不支持以下參數(s)。
min_periods的觀點是不支持
例子
> > >df=ps。DataFrame({“s1 ':(2,比上年,6,2),…“s2”:(3,6,比上年,1。]})> > >s1=df。s1> > >s2=df。s2> > >s1。相關係數(s2,方法=皮爾森的)-0.851064……
> > >s1。相關係數(s2,方法=“槍兵”)-0.948683……