StreamingKMeans

pyspark.mllib.clustering。 StreamingKMeans ( k:int=2,decayFactor:浮動=1.0,timeUnit:str=“批” )

提供方法來設置k、decayFactor timeUnit配置傳入dstreams KMeans算法擬合和預測。提供更多細節重心是如何更新的文檔下StreamingKMeansModel。

參數
k int,可選

數量的集群。(默認值:2)

decayFactor 浮動,可選

遺忘以前的重心。(默認值:1.0)

timeUnit str,可選

可以“批次”或“點”。如果點,衰減係數提出的一些新的分如果批次,則將使用衰減係數。(默認:“批次”)

方法

latestModel()

返回最新的模型

predictOn(dstream)

dstream作出預測。

predictOnValues(dstream)

鍵控dstream作出預測。

setDecayFactor(decayFactor)

衰減係數。

setHalfLife(半衰期timeUnit)

設置後的批次數量的重心,特定批weightage的一半。

setInitialCenters(中心、重量)

設置初始中心。

setK(k)

設置集群的數量。

setRandomCenters(暗、重量、種子)

設置初始中心與常數隨機樣本人口高斯權重。

trainOn(dstream)

在傳入dstream火車模型。

方法的文檔

latestModel ( )→可選( pyspark.mllib.clustering.StreamingKMeansModel ]

返回最新的模型

predictOn ( dstream:DStream(VectorLike] )→DStream(int]

dstream作出預測。返回一個轉換dstream對象

predictOnValues ( dstream:DStream(元組(T,VectorLike]] )→DStream(元組(T,int] ]

鍵控dstream作出預測。返回一個轉換dstream對象。

setDecayFactor ( decayFactor:浮動 )pyspark.mllib.clustering.StreamingKMeans

衰減係數。

setHalfLife ( 半衰期:浮動,timeUnit:str )pyspark.mllib.clustering.StreamingKMeans

設置後的批次數量的重心,特定批weightage的一半。

setInitialCenters ( 中心:列表(VectorLike],權重:列表(浮動] )→StreamingKMeans

設置初始中心。應設置在調用trainOn之前。

setK ( k:int )pyspark.mllib.clustering.StreamingKMeans

設置集群的數量。

setRandomCenters ( 昏暗的:int,重量:浮動,種子:int )pyspark.mllib.clustering.StreamingKMeans

設置初始中心與常數隨機樣本人口高斯權重。

trainOn ( dstream:DStream(VectorLike] )→沒有

在傳入dstream火車模型。