随着人工智能技术的飞速发展,大模型作为人工智能领域的重要突破,正逐渐成为推动产业变革的关键力量。乐天集团作为日本知名企业,近日发布了其首个大语言模型Rakuten AI 2.0,旨在引领智能新潮流。
Rakuten AI 2.0:混合专家架构的强大模型
Rakuten AI 2.0基于混合专家(MoE)架构,由八个各自拥有70亿参数的模型组成,每个模型充当一个专家。这种架构使得模型在处理输入的token时,能够将其发送给最相关的两个专家,由路由器负责选择。这种设计使得Rakuten AI 2.0在处理日英双语数据方面表现出色。
模型获取与应用
所有模型均采用Apache2.0许可协议,用户可在乐天集团的Hugging Face官方库中获取。这使得Rakuten AI 2.0适用于多种文本生成任务,如文本生成、内容摘要、问答、文本理解及对话系统构建等。此外,这些模型还可作为其他模型的基础,便于进一步的开发和应用。
成本效益与优化
Rakuten AI 2.0mini作为一款全新的、参数量为15亿的稠密模型,专为成本效益高的边缘设备部署而设计。它同样在日英混合数据上进行训练,目的是提供便捷的解决方案。这两款模型均经过指令微调和偏好优化,发布了基础模型和指令模型,以满足不同用户的需求。
乐天集团AI战略
乐天集团首席AI与数据官蔡婷表示:“我为我们的团队如何将数据、工程和科学结合起来,推出Rakuten AI 2.0感到无比自豪。我们的新AI模型提供了强大且具成本效益的解决方案,帮助企业做出智能决策,加快价值实现,并开启新的可能性。”
乐天集团通过推出Rakuten AI 2.0,旨在加速日本的AI发展,鼓励所有日本企业进行构建、实验和成长,推动一个协作共赢的社区。
总结
乐天集团的Rakuten AI 2.0大模型的发布,标志着日本在人工智能领域的重要突破。随着AI技术的不断进步,大模型将在未来智能发展潮流中扮演越来越重要的角色。乐天集团通过引领这一潮流,有望为日本乃至全球的AI产业发展注入新的活力。