pyspark.RDD.randomSplit¶
-
抽樣。
randomSplit
( 權重:序列(聯盟(int,浮動]],種子:可選(int]=沒有一個 )→列表(pyspark.rdd.RDD(T] ] ¶ -
隨機分裂這個抽樣所提供的重量。
- 權重列表
-
權重分裂,將歸一化如果他們不總和為1
- 種子int,可選
-
隨機種子
- 返回
-
- 列表
-
列表中抽樣
例子
> > >抽樣=sc。並行化(範圍(500年),1)> > >rdd1,rdd2=抽樣。randomSplit([2,3),17)> > >len(rdd1。收集()+rdd2。收集())500年> > >150年<rdd1。數()<250年真正的> > >250年<rdd2。數()<350年真正的