06-28-202208:36我
你好,我想用KMeans模型或高斯混合模型聚類算法使用SparkML庫,我希望指定初始質心。選擇給初始質心在火花MLlib基於抽樣的api)然而在Pyspark DataFrame基於api (SparkML)。因為火花MLlib維護模式,我不想使用它,而不是使用SaprkML庫。有人知道是一個解決方案嗎?謝謝你!
06-30-202203:15我
嗨@Hari Manassery Koduvely,這頁麵在MLlib描述聚類算法。的指導RDD-based集群的API對這些算法也有相關的信息。
07-05-2022上午06:39
嗨@Kaniz所有,謝謝你的回應。自從MLlib目前在維護模式下我們不想在生產中使用它,因此想用SparkML(基於數據幀的api)。問題是這樣的。在SparkML庫並沒有提及如何輸入用戶指定的k - means或GMM的重心。這是我的問題。
08-04-202207:52我
@Kaniz Fatma我仍然沒有回答我的問題! ! !
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。