FPGrowthModel¶
-
類
pyspark.mllib.fpm。
FPGrowthModel
( java_model:py4j.java_gateway.JavaObject ) ¶ -
FP-Growth模型使用並行FP-Growth挖掘頻繁項集的算法。
例子
> > >數據=[[“一個”,“b”,“c”),(“一個”,“b”,“d”,“e”),(“一個”,“c”,“e”),(“一個”,“c”,“f”]]> > >抽樣=sc。並行化(數據,2)> > >模型=FPGrowth。火車(抽樣,0.6,2)> > >排序(模型。freqItemsets()。收集())[FreqItemset(項目= [a],頻率= 4),FreqItemset(項目= [' c '],頻率= 3),…> > >model_path=temp_path+“/ fpm”> > >模型。保存(sc,model_path)> > >sameModel=FPGrowthModel。負載(sc,model_path)> > >排序(模型。freqItemsets()。收集())= =排序(sameModel。freqItemsets()。收集())真正的
方法
調用
(名字,*一個)調用的方法java_model
返回此模型的頻繁項集。
負載
(sc路徑)從給定的路徑加載模型。
保存
(sc路徑)這個模型保存到給定的路徑。
方法的文檔
-
調用
( 的名字:str,*一個:任何 )→任何¶ -
調用的方法java_model
-
freqItemsets
( )→pyspark.rdd.RDD(pyspark.mllib.fpm.FPGrowth.FreqItemset] ¶ -
返回此模型的頻繁項集。
-
classmethod
負載
( sc:pyspark.context.SparkContext,路徑:str )→pyspark.mllib.fpm.FPGrowthModel ¶ -
從給定的路徑加載模型。
-
保存
( sc:pyspark.context.SparkContext,路徑:str )→沒有¶ -
這個模型保存到給定的路徑。
-