pyspark.RDD.randomSplit

抽樣。 randomSplit ( 權重:序列(聯盟(int,浮動]],種子:可選(int]=沒有一個 )→列表(pyspark.rdd.RDD(T] ]

隨機分裂這個抽樣所提供的重量。

權重列表

權重分裂,將歸一化如果他們不總和為1

種子int,可選

隨機種子

返回
列表

列表中抽樣

例子

> > >抽樣=sc並行化(範圍(500年),1)> > >rdd1,rdd2=抽樣randomSplit([2,3),17)> > >len(rdd1收集()+rdd2收集())500年> > >150年<rdd1()<250年真正的> > >250年<rdd2()<350年真正的