pyspark.streaming.DStream.groupByKeyAndWindow

DStream。 groupByKeyAndWindow ( windowDuration:int,slideDuration:int,numPartitions:可選(int]=沒有一個 )→pyspark.streaming.dstream.DStream(元組(K,Iterable(V] ] ]

返回一個新的DStream通過應用groupByKey滑動窗口。類似於DStream.groupByKey (),但它適用於滑動窗口。

參數
windowDuration int

窗口的寬度;必須是一個多個DStream的批處理區間

slideDuration int

滑動窗口的時間間隔(即。,the interval after which the new DStream will generate RDDs); must be a multiple of this DStream’s batching interval

numPartitions int,可選

分區數量的每個新DStream抽樣。