07-03-202304:56點
我試著運行多莉nc6s_v3 128 GB單一節點集群上演示但得到以下的內存。有人有什麼建議為什麼這是/如何解決它?謝謝
OutOfMemoryError:CUDA的內存。試圖分配20.00 MiB (GPU 0;15.78鑲條總容量;14.48直布羅陀海峽已經分配;5.50 MiB自由;總共14.64鑲條保留PyTorch)如果> >保留內存分配的內存設置max_split_size_mb避免碎片。為內存管理和PYTORCH_CUDA_ALLOC_CONF見文檔
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。