FPGrowth¶
-
類
pyspark.mllib.fpm。
FPGrowth
¶ -
一個平行FP-growth算法挖掘頻繁項集。
方法
火車
(數據[、minSupport numPartitions])計算一個FP-Growth模型,包含頻繁項集。
方法的文檔
-
classmethod
火車
( 數據:pyspark.rdd.RDD(列表(T]],minSupport:浮動=0.3,numPartitions:int=- 1 )→pyspark.mllib.fpm.FPGrowthModel ¶ -
計算一個FP-Growth模型,包含頻繁項集。
- 參數
-
-
數據
pyspark.RDD
-
輸入數據集,每個元素包含一個事務。
- minSupport 浮動,可選
-
最小的支持水平。(默認值:0.3)
- numPartitions int,可選
-
分區的數量由平行FP-growth使用。值將使用相同數量的輸入數據。(默認值:1)
-
數據
-
classmethod