pyspark.pandas.DataFrame.spark.repartition

火花。 重新分區 ( num_partitions:int )→ps.DataFrame

返回一個新的DataFrame分區的分區表達式。結果DataFrame散列分區。

參數
num_partitions int

目標分區的數量。

返回
DataFrame

例子

> > >psdf=psDataFrame({“年齡”:(5,5,2,2),“名稱”:(“Bob”,“Bob”,“愛麗絲”,“愛麗絲”]})set_index(“年齡”)> > >psdfsort_index()的名字年齡2愛麗絲2愛麗絲5鮑勃5鮑勃> > >new_psdf=psdf火花重新分區(7)> > >new_psdfto_spark()抽樣getNumPartitions()7> > >new_psdfsort_index()的名字年齡2愛麗絲2愛麗絲5鮑勃5鮑勃