pyspark.RDD.persist

抽樣。 堅持 ( storageLevel:pyspark.storagelevel.StorageLevel=StorageLevel(假的,真的,假的,假的,1) )→pyspark.rdd.RDD(T]

設置這個抽樣後的存儲水平持續其值在業務第一次計算。這隻能用於分配一個新的存儲水平,如果抽樣沒有存儲水平集。如果沒有指定存儲級別默認值(MEMORY_ONLY)。

例子

> > >抽樣=sc並行化([“b”,“一個”,“c”])> > >抽樣堅持()is_cached真正的