pyspark.pandas.DataFrame.spark.repartition¶
-
火花。
重新分區
( num_partitions:int )→ps.DataFrame¶ -
返回一個新的DataFrame分區的分區表達式。結果DataFrame散列分區。
- 參數
-
- num_partitions int
-
目標分區的數量。
- 返回
-
- DataFrame
例子
> > >psdf=ps。DataFrame({“年齡”:(5,5,2,2),…“名稱”:(“Bob”,“Bob”,“愛麗絲”,“愛麗絲”]})。set_index(“年齡”)> > >psdf。sort_index()的名字年齡2愛麗絲2愛麗絲5鮑勃5鮑勃> > >new_psdf=psdf。火花。重新分區(7)> > >new_psdf。to_spark()。抽樣。getNumPartitions()7> > >new_psdf。sort_index()的名字年齡2愛麗絲2愛麗絲5鮑勃5鮑勃