正文

蚂蚁集团新突破：揭秘蚂蚁大模型研发进展

/2025-03-30 08:57:13 /0 浏览量

0330

蚂蚁集团新突破：揭秘蚂蚁大模型研发进展

引言

近年来，人工智能（AI）技术发展迅速，大模型在各个领域展现出巨大的潜力。蚂蚁集团作为国内领先的金融科技公司，在AI领域也取得了显著的突破。本文将揭秘蚂蚁集团在大模型研发方面的最新进展，包括技术突破、成本降低以及应用场景等方面。

技术突破

混合专家（MoE）模型：蚂蚁集团Ling团队在预印版Arxiv平台上发布了技术论文《每一个FLOP都至关重要：无需高级GPU即可扩展3000亿参数混合专家LING大模型》。该论文介绍了两款新型大语言模型：百灵轻量版（Ling-Lite）和百灵增强版(Ling-Plus)。这两款模型在设计上采用了多项创新，能够在低性能硬件上高效训练，显著降低了成本。
国产AI芯片应用：蚂蚁集团在AI模型训练中使用了国产AI芯片，实现了与英伟达H800等高端芯片相当的效果。这一突破表明，蚂蚁集团在AI领域的技术实力得到了显著提升。
创新训练策略：蚂蚁集团在模型训练过程中，采用了动态参数分配、混合精度调度以及升级的训练异常处理机制，有效缩短了中断响应时间，并优化了模型评估流程，压缩了验证周期超过50%。

成本降低

降低训练成本：通过使用国产AI芯片和优化训练策略，蚂蚁集团将大模型训练成本降低了约20%。例如，使用低规格硬件系统训练1万亿token的成本约为508万元人民币，相比使用高性能硬件设备降低了近20%。
提高性价比：蚂蚁集团的大模型在性能与成本之间取得了良好平衡，为国产大模型提供了更加经济高效的解决方案。

应用场景

生活服务：蚂蚁集团的大模型可以应用于智能客服、智能推荐、智能语音助手等领域，提升用户体验。
金融服务：大模型在金融风控、智能投顾、智能保险等领域具有广泛应用前景。
医疗健康：大模型可以用于辅助诊断、智能药物研发、健康管理等场景，提高医疗行业效率。

总结

蚂蚁集团在大模型研发方面取得了显著突破，不仅降低了训练成本，还提高了模型性能。未来，蚂蚁集团将继续加大AI技术研发投入，推动AI技术在各个领域的应用，为我国AI产业发展贡献力量。

-- 展开阅读全文 --

相关阅读

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权、违法违规、事实不符，请联系我们进行投诉反馈，一经查实，立即处理！
转载请注明出处，原文链接：https://www.sjyjct.com/news/ma-yi-ji-tuan-xin-tu-po-jie-mi-ma-yi-da-mo-xing-yan-fa-jin-zhan.html