12-14-202206:12點
我有一個問題與AutoML。我拯救我的數據表。AutoML運行後,我檢查的一個筆記本中的dataframe AutoML和比較它與我的原始數據。我意識到的行數是不同的。AutoML使用% 80的數據。問題是,這種% 82數據包含培訓/測試/ val正如你所看到的圖片。這是為什麼呢?
我有點新磚和Automl。我想聽到你的意見。
12-15-202206:08我
嗨@A。貓
與磚運行時9.1 LTS毫升以上,AutoML自動樣本數據集,如果太大了,適合一個工作節點的記憶。
你將能夠找到一些食譜如何處理大數據集與AutoML文檔:
https://docs.www.eheci.com/machine-learning/automl/how-automl-works.html sampling-large-datasets
HTH
勞倫特
12-15-202212:53點
謝謝你洛朗,
這是有意義的。
我檢查我的數據。最初,我有75個目標值。磚規模隻有第一個6最大的。我理解這樣做隻是為了記憶配件而不是平衡數據。不平衡數據集,我認為我需要采取其他措施,不僅信任磚,對吧?
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。