pyspark.sql.DataFrame.randomSplit

DataFrame。 randomSplit ( 權重:列表(浮動],種子:可選(int]=沒有一個 )→列表(pyspark.sql.dataframe.DataFrame]

隨機將這DataFrame與所提供的重量。

參數
權重 列表

列表將翻倍的重量DataFrame。權重將規範化如果不總結1.0。

種子 int,可選

抽樣的種子。

例子

> > >分裂=df4randomSplit([1.0,2.0),24)> > >分裂(0]()2
> > >分裂(1]()2