取消
顯示的結果
而不是尋找
你的意思是:

火花MLlib,估計量和變壓器之間的區別是什麼?

User16826992666
價值貢獻
1接受解決方案

接受的解決方案

sean_owen
尊敬的貢獻者二世
尊敬的貢獻者二世

這些術語借用scikit-learn,和我們的想法是相同的。變壓器隻是管道的一個組件,轉換數據。一個估計量也是一個動變壓器,但另外需要“適應”數據之前,知道如何變換。

例如,StringTokenizer隻是一個變壓器,因為它不需要看任何數據知道要做什麼,來標記字符串。機器學習模型像LogisticRegression也是一個變壓器,因為它將數據通過添加一個預測。但是它必須是適合數據之前,首先它可以這樣做。所以它(也)是一個估計量。

在原帖子查看解決方案

1回複1

sean_owen
尊敬的貢獻者二世
尊敬的貢獻者二世

這些術語借用scikit-learn,和我們的想法是相同的。變壓器隻是管道的一個組件,轉換數據。一個估計量也是一個動變壓器,但另外需要“適應”數據之前,知道如何變換。

例如,StringTokenizer隻是一個變壓器,因為它不需要看任何數據知道要做什麼,來標記字符串。機器學習模型像LogisticRegression也是一個變壓器,因為它將數據通過添加一個預測。但是它必須是適合數據之前,首先它可以這樣做。所以它(也)是一個估計量。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map