正文

大模型微调:揭秘预训练显存需求的优化之道