pyspark.pandas.groupby.GroupBy.head

GroupBy。 ( n:int=5 )→FrameLike

每組返回的第n行。

返回
DataFrame或係列

例子

> > >df=psDataFrame({“一個”:(1,1,1,1,2,2,2,3,3,3),“b”:(2,3,1,4,6,9,8,10,7,5),“c”:(3,5,2,5,1,2,6,4,3,6)},=(“一個”,“b”,“c”),指數=(7,2,4,1,3,4,9,10,5,6])> > >dfa b c7 1 2 32 1 3 54 1 1 21 1 4 53 2 6 14 2 9 29 2 8 610 3 45 3 7 36 3 5 6
> > >dfgroupby(“一個”)(2)sort_index()a b c2 1 3 53 2 6 14 2 9 25 3 7 37 1 2 310 3 4
> > >dfgroupby(“一個”)[“b”](2)sort_index()2 33個64個95 77 - 210 10名稱:b, dtype: int64

支持Groupby位置索引因為熊貓火花3.4(熊貓1.4 +):

> > >df=psDataFrame([[“g”,“g0”),(“g”,“g1”),(“g”,“兩國集團”),(“g”,“g3”),(“h”,“h0”),(“h”,“標題”]],=(“一個”,“B”])> > >dfgroupby(“一個”)(- - - - - -1)一個B0 g g01 g g12 g g24 h h0