PowerIterationClusteringModel

pyspark.mllib.clustering。 PowerIterationClusteringModel ( java_model:py4j.java_gateway.JavaObject )

模型由PowerIterationClustering

例子

> > >進口數學> > >defgenCircle(r,n):=[]範圍(0,n):θ=2.0*數學π*/n附加((r*數學因為(θ),r*數學(θ)))返回> > >defsim卡(x,y):dist2=(x(0]- - - - - -y(0])*(x(0]- - - - - -y(0])+(x(1]- - - - - -y(1])*(x(1]- - - - - -y(1])返回數學經驗值(- - - - - -dist2/2.0)> > >r1=1.0> > >n1=10> > >r2=4.0> > >n2=40> > >n=n1+n2> > >=genCircle(r1,n1)+genCircle(r2,n2)> > >相似之處=((,j,sim卡((),(j)))範圍(1,n)j範圍(0,)]> > >抽樣=sc並行化(相似之處,2)> > >模型=PowerIterationClustering火車(抽樣,2,40)> > >模型k2> > >結果=排序(模型作業()收集(),關鍵=λx:xid)> > >結果(0]集群= =結果(1]集群= =結果(2]集群= =結果(3]集群真正的> > >結果(4]集群= =結果(5]集群= =結果(6]集群= =結果(7]集群真正的> > >進口操作係統,tempfile> > >路徑=tempfilemkdtemp()> > >模型保存(sc,路徑)> > >sameModel=PowerIterationClusteringModel負載(sc,路徑)> > >sameModelk2> > >結果=排序(模型作業()收集(),關鍵=λx:xid)> > >結果(0]集群= =結果(1]集群= =結果(2]集群= =結果(3]集群真正的> > >結果(4]集群= =結果(5]集群= =結果(6]集群= =結果(7]集群真正的> > >shutil進口rmtree> > >試一試:rmtree(路徑)除了OSError:通過

方法

作業()

返回此模型的集群作業。

調用(名字,*一個)

調用的方法java_model

負載(sc路徑)

從給定的路徑加載模型。

保存(sc路徑)

這個模型保存到給定的路徑。

屬性

k

返回的數量集群。

方法的文檔

作業 ( )→pyspark.rdd.RDD(pyspark.mllib.clustering.PowerIterationClustering.Assignment]

返回此模型的集群作業。

調用 ( 的名字:str,*一個:任何 )→任何

調用的方法java_model

classmethod 負載 ( sc:pyspark.context.SparkContext,路徑:str )pyspark.mllib.clustering.PowerIterationClusteringModel

從給定的路徑加載模型。

保存 ( sc:pyspark.context.SparkContext,路徑:str )→沒有

這個模型保存到給定的路徑。

屬性的文檔

k

返回的數量集群。