抽樣。
countApprox
近似的版本數(),它返回一個潛在的不完整的結果在一個超時,即使不是所有任務都完成了。
例子
> > >抽樣=sc。並行化(範圍(1000年),10)> > >抽樣。countApprox(1000年,1.0)1000年
以前的
pyspark.RDD.count
下一個
pyspark.RDD.countApproxDistinct