pyspark.streaming.DStream.window

DStream。 窗口 ( windowDuration:int,slideDuration:可選(int]=沒有一個 )→pyspark.streaming.dstream.DStream(T]

返回一個新的DStream每個抽樣包含的所有元素在時間滑動窗口中看到這個DStream。

參數
windowDuration int

窗口的寬度;必須是一個多個DStream的批處理區間

slideDuration int,可選

滑動窗口的時間間隔(即。,the interval after which the new DStream will generate RDDs); must be a multiple of this DStream’s batching interval