FPGrowth

pyspark.mllib.fpm。 FPGrowth

一個平行FP-growth算法挖掘頻繁項集。

方法

火車(數據[、minSupport numPartitions])

計算一個FP-Growth模型,包含頻繁項集。

方法的文檔

classmethod 火車 ( 數據:pyspark.rdd.RDD(列表(T]],minSupport:浮動=0.3,numPartitions:int=- 1 )pyspark.mllib.fpm.FPGrowthModel

計算一個FP-Growth模型,包含頻繁項集。

參數
數據 pyspark.RDD

輸入數據集,每個元素包含一個事務。

minSupport 浮動,可選

最小的支持水平。(默認值:0.3)

numPartitions int,可選

分區的數量由平行FP-growth使用。值將使用相同數量的輸入數據。(默認值:1)