取消
顯示的結果
而不是尋找
你的意思是:

如何automl分類特征是數字還是分類?

anonturtle
新的因素

automl運行時它的UI,它把一個功能“local_convenience_store”作為數字和分類列。這會影響數字列一個標量的結果是使用在一個分類列是一個炎熱的編碼。

上下文的特性dtype熊貓int32,值從1到10。

因此,我想問如何automl分類列數字和哪個列分類?它是基於low-cardinality嗎?

謝謝你的觀看:slightly_smiling_face:

1回複1

匿名
不適用

@hr:

AutoML采取的方法分類特性數值或分類取決於特定AutoML框架或庫使用,因為不同的實現可能使用不同的方法或啟發式來讓這個決心。

一般來說,一些常見的方法包括:

  1. 檢查的數據類型特點:這是一個簡單和直接的方法,int數據類型的一個特征,浮動或類似的被認為是數字,而一個功能一個字符串或對象數據類型被認為是絕對的。然而,這種方法可以作為一些特性可能被表示成有限整數但實際上是分類變量(如郵政編碼)。
  2. 分析的惟一值特點:功能較低數量的惟一值(如小於某一閾值)可能是直言,雖然功能有大量獨特的價值可能是數字。這種方法適用於一些數據集分類和數字特性的區別是顯而易見的,但是是很有挑戰性的,選擇一個合適的閾值。
  3. 使用領域知識:在某些情況下,數據科學家可能對數據和領域知識的意義的特性,可以用來確定一個特性是分類或數字。

值得注意的是,一個特性的分類為數字或分類可以對機器學習模型的性能產生重大影響。AutoML而言,具體的方法用於分類特征可能取決於所使用的特定算法,以及算法設計如何處理不同類型的特性。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map