pyspark.pandas.groupby.SeriesGroupBy.value_counts¶
-
SeriesGroupBy。
value_counts
( 排序:可選(bool]=沒有一個,提升:可選(bool]=沒有一個,dropna:bool=真正的 )→pyspark.pandas.series.Series¶ -
計算組大小。
- 參數
-
- 排序 布爾,默認沒有
-
通過頻率。
- 提升 布爾,默認的錯誤
-
按升序排序。
- dropna 布爾,默認的真
-
不包括項南。
例子
> > >df=ps。DataFrame({“一個”:(1,2,2,3,3,3),…“B”:(1,1,2,3,3,np。南)},…列=(“一個”,“B”])> > >df一個B0 1 1.01 2 1.02 2 2.03 3 3.04 3 3.05 3南
> > >df。groupby(“一個”)[“B”]。value_counts()。sort_index()一個B1 1.0 - 12 1.0 - 12.0 - 13 3.0 - 2名稱:B, dtype: int64
不包括項南當dropna是錯誤的。
> > >df。groupby(“一個”)[“B”]。value_counts(…dropna=假)。sort_index()一個B1 1.0 - 12 1.0 - 12.0 - 13 3.0 - 2南1名稱:B, dtype: int64