KMeansSummary

pyspark.ml.clustering。 KMeansSummary ( java_obj:可選(JavaObject]=沒有一個 )

KMeans的總結。

屬性

集群

DataFrame預測集群中心為每一個訓練數據點。

clusterSizes

的大小(數據點的數量)每個集群。

featuresCol

列的功能預測

k

集群的數量模型訓練。

numIter

的迭代次數。

predictionCol

預測集群的名稱列預測

預測

DataFrame產生的模型變換方法。

trainingCost

k - means成本(距離平方的總和為所有點最近的重心在訓練數據集)。

屬性的文檔

集群

DataFrame預測集群中心為每一個訓練數據點。

clusterSizes

的大小(數據點的數量)每個集群。

featuresCol

列的功能預測

k

集群的數量模型訓練。

numIter

的迭代次數。

predictionCol

預測集群的名稱列預測

預測

DataFrame產生的模型變換方法。

trainingCost

k - means成本(距離平方的總和為所有點最近的重心在訓練數據集)。這相當於sklearn的慣性。