AutoML沒有使用我的整個數據集-磚- 16809

cat017 · ‎12-14-2022

我有一個問題與AutoML。我拯救我的數據表。AutoML運行後,我檢查的一個筆記本中的dataframe AutoML和比較它與我的原始數據。我意識到的行數是不同的。AutoML使用% 80的數據。問題是,這種% 82數據包含培訓/測試/ val正如你所看到的圖片。這是為什麼呢?

我有點新磚和Automl。我想聽到你的意見。

Laurent_Leturge · ‎12-15-2022

嗨@A。貓

與磚運行時9.1 LTS毫升以上,AutoML自動樣本數據集,如果太大了,適合一個工作節點的記憶。

你將能夠找到一些食譜如何處理大數據集與AutoML文檔:

HTH

勞倫特

cat017 · ‎12-15-2022

謝謝你洛朗,

這是有意義的。

我檢查我的數據。最初,我有75個目標值。磚規模隻有第一個6最大的。我理解這樣做隻是為了記憶配件而不是平衡數據。不平衡數據集,我認為我需要采取其他措施,不僅信任磚,對吧?