pyspark.RDD.saveAsSequenceFile

抽樣。 saveAsSequenceFile ( 路徑:str,compressionCodecClass:可選(str]=沒有一個 )→沒有

輸出一個Python抽樣的鍵-值對的形式抽樣[(K,V)))任何Hadoop文件係統,使用“org.apache.hadoop.io。可寫“類型,我們將從抽樣的鍵和值類型。機理如下:

  1. 泡菜是用來醃Python抽樣轉換成Java對象的抽樣。

  2. 鍵和值的Java抽樣轉換為可寫,寫出來。

參數
路徑 str

順序文件路徑

compressionCodecClass str,可選

壓縮編解碼器類的完全限定類名即“org.apache.hadoop.io.compress.GzipCodec”(默認情況下沒有一個)