pyspark.RDD.saveAsPickleFile

抽樣。 saveAsPickleFile ( 路徑:str,batchSize:int=10 )→沒有

保存這個抽樣的SequenceFile序列化的對象。使用的序列化器是pyspark.serializers.CPickleSerializer、默認批大小是10。

例子

> > >tempfile進口NamedTemporaryFile> > >臨時文件=NamedTemporaryFile(刪除=真正的)> > >臨時文件關閉()> > >sc並行化([1,2,“火花”,“抽樣”])saveAsPickleFile(臨時文件的名字,3)> > >排序(scpickleFile(臨時文件的名字,5)地圖(str)收集())[' 1 ',' 2 ',“抽樣”,“火花”)