pyspark.pandas.groupby.GroupBy.cumcount

GroupBy。 cumcount ( 提升:bool=真正的 )→pyspark.pandas.series.Series

每一項數量每組的長度從0 - 1。

這相當於

自我應用(λx:pd係列(np不等(len(x)),x指數))
參數
提升 bool,默認的真

如果假的,反過來,從集團- 1的長度為0。

返回
係列

每組內每個元素的序號。

例子

> > >df=psDataFrame([[“一個”),(“一個”),(“一個”),(“b”),(“b”),(“一個”]],=(“一個”])> > >df一個0一個123 b4 b5> > >dfgroupby(“一個”)cumcount()sort_index()0 012 - 23 04個15個3dtype: int64> > >dfgroupby(“一個”)cumcount(提升=)sort_index()0 31 22 13個14 05 0dtype: int64