FPGrowthModel

pyspark.mllib.fpm。 FPGrowthModel ( java_model:py4j.java_gateway.JavaObject )

FP-Growth模型使用並行FP-Growth挖掘頻繁項集的算法。

例子

> > >數據=[[“一個”,“b”,“c”),(“一個”,“b”,“d”,“e”),(“一個”,“c”,“e”),(“一個”,“c”,“f”]]> > >抽樣=sc並行化(數據,2)> > >模型=FPGrowth火車(抽樣,0.6,2)> > >排序(模型freqItemsets()收集())[FreqItemset(項目= [a],頻率= 4),FreqItemset(項目= [' c '],頻率= 3),…> > >model_path=temp_path+“/ fpm”> > >模型保存(sc,model_path)> > >sameModel=FPGrowthModel負載(sc,model_path)> > >排序(模型freqItemsets()收集())= =排序(sameModelfreqItemsets()收集())真正的

方法

調用(名字,*一個)

調用的方法java_model

freqItemsets()

返回此模型的頻繁項集。

負載(sc路徑)

從給定的路徑加載模型。

保存(sc路徑)

這個模型保存到給定的路徑。

方法的文檔

調用 ( 的名字:str,*一個:任何 )→任何

調用的方法java_model

freqItemsets ( )→pyspark.rdd.RDD(pyspark.mllib.fpm.FPGrowth.FreqItemset]

返回此模型的頻繁項集。

classmethod 負載 ( sc:pyspark.context.SparkContext,路徑:str )pyspark.mllib.fpm.FPGrowthModel

從給定的路徑加載模型。

保存 ( sc:pyspark.context.SparkContext,路徑:str )→沒有

這個模型保存到給定的路徑。