pyspark.pandas.groupby.GroupBy.cumcount¶
-
GroupBy。
cumcount
( 提升:bool=真正的 )→pyspark.pandas.series.Series¶ -
每一項數量每組的長度從0 - 1。
這相當於
自我。應用(λx:pd。係列(np。不等(len(x)),x。指數))
- 參數
-
- 提升 bool,默認的真
-
如果假的,反過來,從集團- 1的長度為0。
- 返回
-
- 係列
-
每組內每個元素的序號。
例子
> > >df=ps。DataFrame([[“一個”),(“一個”),(“一個”),(“b”),(“b”),(“一個”]],…列=(“一個”])> > >df一個0一個123 b4 b5> > >df。groupby(“一個”)。cumcount()。sort_index()0 012 - 23 04個15個3dtype: int64> > >df。groupby(“一個”)。cumcount(提升=假)。sort_index()0 31 22 13個14 05 0dtype: int64