点击上方“Deephub Imba”,关注公众号,好文章不错过 !模型有 2 亿个参数,fp32 精度下理论上只需 800 MB。为什么 24 GB 的 GPU 却满了?原因在于模型参数只是训练期间占用 GPU ...