GaussianMixture

pyspark.mllib.clustering。 GaussianMixture

使用采用算法對高斯混合學習算法。

方法

火車抽樣,k [、convergenceTol…])

訓練高斯混合聚類模型。

方法的文檔

classmethod 火車 ( 抽樣:pyspark.rdd.RDD(VectorLike],k:int,convergenceTol:浮動=0.001,maxIterations:int=One hundred.,種子:可選(int]=沒有一個,initialModel:可選(pyspark.mllib.clustering.GaussianMixtureModel]=沒有一個 )pyspark.mllib.clustering.GaussianMixtureModel

訓練高斯混合聚類模型。

參數
抽樣 :pyspark.RDD

作為一個訓練點抽樣pyspark.mllib.linalg.Vector或可轉換序列類型。

k int

許多獨立的高斯函數的混合模型。

convergenceTol 浮動,可選

最大變化的對數似融合被認為是發生。(默認值:1 e - 3)

maxIterations int,可選

允許的最大迭代數。(默認:100)

種子 int,可選

隨機種子初始高斯分布。基於係統時間設置為不產生種子。(默認值:無)

initialModel GaussianMixtureModel,可選

最初的GMM的起點,繞過隨機初始化。(默認值:無)