你好,
我用pynote /耳語大型模型,試圖使用火花UDF過程數據和跟蹤誤差。
torch.cuda。OutOfMemoryError: CUDA的內存。試圖分配172.00 MiB (GPU 0;14.76鑲條總容量;6.07直布羅陀海峽已經分配;120.75 MiB自由;總共6.25鑲條保留PyTorch)如果> >保留內存分配的內存設置max_split_size_mb避免碎片。為內存管理和PYTORCH_CUDA_ALLOC_CONF見文檔
工作是配置了11.3 LTS與1 - 8毫升G4dn的實例。4超大集群。
感激如果你能提供任何的幫助。
問候,
桑傑
@Sanjay耆那教的:
錯誤消息顯示,沒有足夠的可用內存的GPU分配PyTorch模型。這個錯誤可能發生如果模型太大了,適合GPU的可用內存,或者如果GPU內存被其他進程除了PyTorch模型。
你可以嚐試實現下麵,看看有什麼適合你
我希望這些建議幫助!
@Sanjay耆那教的:
錯誤消息顯示,沒有足夠的可用內存的GPU分配PyTorch模型。這個錯誤可能發生如果模型太大了,適合GPU的可用內存,或者如果GPU內存被其他進程除了PyTorch模型。
你可以嚐試實現下麵,看看有什麼適合你
我希望這些建議幫助!