pyspark.pandas.groupby.SeriesGroupBy.value_counts

SeriesGroupBy。 value_counts ( 排序:可選(bool]=沒有一個,提升:可選(bool]=沒有一個,dropna:bool=真正的 )→pyspark.pandas.series.Series

計算組大小。

參數
排序 布爾,默認沒有

通過頻率。

提升 布爾,默認的錯誤

按升序排序。

dropna 布爾,默認的真

不包括項南。

例子

> > >df=psDataFrame({“一個”:(1,2,2,3,3,3),“B”:(1,1,2,3,3,np)},=(“一個”,“B”])> > >df一個B0 1 1.01 2 1.02 2 2.03 3 3.04 3 3.05 3南
> > >dfgroupby(“一個”)[“B”]value_counts()sort_index()一個B1 1.0 - 12 1.0 - 12.0 - 13 3.0 - 2名稱:B, dtype: int64

不包括項南當dropna是錯誤的。

> > >dfgroupby(“一個”)[“B”]value_counts(dropna=)sort_index()一個B1 1.0 - 12 1.0 - 12.0 - 13 3.0 - 2南1名稱:B, dtype: int64