pyspark.streaming.StreamingContext.binaryRecordsStream

StreamingContext。 binaryRecordsStream ( 目錄:str,recordLength:int )→pyspark.streaming.dstream.DStream(字節]

創建一個輸入流,監測Hadoop-compatible為新文件和讀取文件係統平麵固定長度的二進製文件與記錄。文件必須寫入監控目錄由“移動”從另一個位置在同一文件係統。文件名開始。將被忽略。

參數
目錄 str

目錄加載數據

recordLength int

每個記錄的長度字節