pyspark.pandas.DataFrame.spark.repartition¶

火花。 重新分區 ( num_partitions:int )→ps.DataFrame¶

返回一個新的DataFrame分區的分區表達式。結果DataFrame散列分區。

參數

num_partitions int: 目標分區的數量。

返回

DataFrame

例子

           > > >psdf=ps。DataFrame({“年齡”:(5,5,2,2),…“名稱”:(“Bob”,“Bob”,“愛麗絲”,“愛麗絲”]})。set_index(“年齡”)> > >psdf。sort_index()的名字年齡2愛麗絲2愛麗絲5鮑勃5鮑勃> > >new_psdf=psdf。火花。重新分區(7)> > >new_psdf。to_spark()。抽樣。getNumPartitions()7> > >new_psdf。sort_index()的名字年齡2愛麗絲2愛麗絲5鮑勃5鮑勃
          

以前的

pyspark.pandas.DataFrame.spark.apply

下一個

pyspark.pandas.DataFrame.spark.coalesce