pyspark.pandas.groupby.GroupBy.cumcount¶

GroupBy。 cumcount ( 提升:bool=真正的 )→pyspark.pandas.series.Series¶

每一項數量每組的長度從0 - 1。

這相當於

           自我。應用(λx:pd。係列(np。不等(len(x)),x。指數))
          

參數

提升 bool,默認的真: 如果假的,反過來,從集團- 1的長度為0。

返回

係列: 每組內每個元素的序號。

例子

           > > >df=ps。DataFrame([[“一個”),(“一個”),(“一個”),(“b”),(“b”),(“一個”]],…列=(“一個”])> > >df一個0一個123 b4 b5> > >df。groupby(“一個”)。cumcount()。sort_index()0 012 - 23 04個15個3dtype: int64> > >df。groupby(“一個”)。cumcount(提升=假)。sort_index()0 31 22 13個14 05 0dtype: int64
          

以前的

pyspark.pandas.groupby.GroupBy.count

下一個

pyspark.pandas.groupby.GroupBy.cummax