PowerIterationClusteringModel¶
-
類
pyspark.mllib.clustering。
PowerIterationClusteringModel
( java_model:py4j.java_gateway.JavaObject ) ¶ -
例子
> > >進口數學> > >defgenCircle(r,n):…點=[]…為我在範圍(0,n):…θ=2.0*數學。π*我/n…點。附加((r*數學。因為(θ),r*數學。罪(θ)))…返回點> > >defsim卡(x,y):…dist2=(x(0]- - - - - -y(0])*(x(0]- - - - - -y(0])+(x(1]- - - - - -y(1])*(x(1]- - - - - -y(1])…返回數學。經驗值(- - - - - -dist2/2.0)> > >r1=1.0> > >n1=10> > >r2=4.0> > >n2=40> > >n=n1+n2> > >點=genCircle(r1,n1)+genCircle(r2,n2)> > >相似之處=((我,j,sim卡(點(我),點(j)))為我在範圍(1,n)為j在範圍(0,我)]> > >抽樣=sc。並行化(相似之處,2)> > >模型=PowerIterationClustering。火車(抽樣,2,40)> > >模型。k2> > >結果=排序(模型。作業()。收集(),關鍵=λx:x。id)> > >結果(0]。集群= =結果(1]。集群= =結果(2]。集群= =結果(3]。集群真正的> > >結果(4]。集群= =結果(5]。集群= =結果(6]。集群= =結果(7]。集群真正的> > >進口操作係統,tempfile> > >路徑=tempfile。mkdtemp()> > >模型。保存(sc,路徑)> > >sameModel=PowerIterationClusteringModel。負載(sc,路徑)> > >sameModel。k2> > >結果=排序(模型。作業()。收集(),關鍵=λx:x。id)> > >結果(0]。集群= =結果(1]。集群= =結果(2]。集群= =結果(3]。集群真正的> > >結果(4]。集群= =結果(5]。集群= =結果(6]。集群= =結果(7]。集群真正的> > >從shutil進口rmtree> > >試一試:…rmtree(路徑)…除了OSError:…通過
方法
作業
()返回此模型的集群作業。
調用
(名字,*一個)調用的方法java_model
負載
(sc路徑)從給定的路徑加載模型。
保存
(sc路徑)這個模型保存到給定的路徑。
屬性
返回的數量集群。
方法的文檔
-
作業
( )→pyspark.rdd.RDD(pyspark.mllib.clustering.PowerIterationClustering.Assignment] ¶ -
返回此模型的集群作業。
-
調用
( 的名字:str,*一個:任何 )→任何¶ -
調用的方法java_model
-
classmethod
負載
( sc:pyspark.context.SparkContext,路徑:str )→pyspark.mllib.clustering.PowerIterationClusteringModel ¶ -
從給定的路徑加載模型。
-
保存
( sc:pyspark.context.SparkContext,路徑:str )→沒有¶ -
這個模型保存到給定的路徑。
屬性的文檔
-
k
¶ -
返回的數量集群。
-