StreamingKMeans¶
-
類
pyspark.mllib.clustering。
StreamingKMeans
( k:int=2,decayFactor:浮動=1.0,timeUnit:str=“批” ) ¶ -
提供方法來設置k、decayFactor timeUnit配置傳入dstreams KMeans算法擬合和預測。提供更多細節重心是如何更新的文檔下StreamingKMeansModel。
- 參數
-
- k int,可選
-
數量的集群。(默認值:2)
- decayFactor 浮動,可選
-
遺忘以前的重心。(默認值:1.0)
- timeUnit str,可選
-
可以“批次”或“點”。如果點,衰減係數提出的一些新的分如果批次,則將使用衰減係數。(默認:“批次”)
方法
返回最新的模型
predictOn
(dstream)dstream作出預測。
predictOnValues
(dstream)鍵控dstream作出預測。
setDecayFactor
(decayFactor)衰減係數。
setHalfLife
(半衰期timeUnit)設置後的批次數量的重心,特定批weightage的一半。
setInitialCenters
(中心、重量)設置初始中心。
setK
(k)設置集群的數量。
setRandomCenters
(暗、重量、種子)設置初始中心與常數隨機樣本人口高斯權重。
trainOn
(dstream)在傳入dstream火車模型。
方法的文檔
-
latestModel
( )→可選( pyspark.mllib.clustering.StreamingKMeansModel ] ¶ -
返回最新的模型
-
predictOn
( dstream:DStream(VectorLike] )→DStream(int] ¶ -
dstream作出預測。返回一個轉換dstream對象
-
predictOnValues
( dstream:DStream(元組(T,VectorLike]] )→DStream(元組(T,int] ] ¶ -
鍵控dstream作出預測。返回一個轉換dstream對象。
-
setDecayFactor
( decayFactor:浮動 )→pyspark.mllib.clustering.StreamingKMeans ¶ -
衰減係數。
-
setHalfLife
( 半衰期:浮動,timeUnit:str )→pyspark.mllib.clustering.StreamingKMeans ¶ -
設置後的批次數量的重心,特定批weightage的一半。
-
setInitialCenters
( 中心:列表(VectorLike],權重:列表(浮動] )→StreamingKMeans¶ -
設置初始中心。應設置在調用trainOn之前。
-
setK
( k:int )→pyspark.mllib.clustering.StreamingKMeans ¶ -
設置集群的數量。
-
setRandomCenters
( 昏暗的:int,重量:浮動,種子:int )→pyspark.mllib.clustering.StreamingKMeans ¶ -
設置初始中心與常數隨機樣本人口高斯權重。
-
trainOn
( dstream:DStream(VectorLike] )→沒有¶ -
在傳入dstream火車模型。