引言
随着人工智能技术的迅猛发展,大模型作为AI领域的核心驱动力,正引领着一场技术革新和产业变革。本文将深入探讨国内大模型的现状,分析各大企业及研究机构在这一领域的布局与成果,旨在揭示谁在引领AI新浪潮。
商汤科技:生成式AI的领跑者
商汤科技在生成式AI领域表现突出,其“大装置-大模型-应用”的三位一体战略,实现了算力大装置、大模型和应用的无缝集成。2024年,商汤科技实现营收37.7亿元,同比增长10.8%,其中生成式AI收入突破24亿元,同比增长103.1%。商汤科技的成功,得益于其对算力基础设施的持续投入,如上海临港AIDC智算中心,以及在大模型技术上的创新。
首都在线:智算业务的崛起
首都在线凭借智算云业务的发展,在2024年实现营业收入13.97亿元,同比增加12.35%。公司顺应下游客户智能化转型需求,推出高附加值智算云服务,促进自身产品迭代升级与资源利用效率优化。在技术创新方面,首都在线持续加大研发投入,汇聚了一批高水平研发人员,为智算业务的发展提供强大支持。
深度求索:开源模型的突破
深度求索(DeepSeek)发布的开源模型DeepSeek-R1,被誉为人工智能的DeepSeek时刻。这一突破标志着中国在AI领域的技术突破正深刻改变全球创新竞争格局,打破了美国对AI话语权的垄断。DeepSeek已在金融、医疗、智能制造等12个重点行业实现规模化应用,为中国AI行业市场规模的扩大贡献力量。
DeepSeek:加速AI普惠与多维度创新
DeepSeek在2025年开年向AI市场投入了一枚重磅炸弹,包括基座模型DeepSeekV3、推理模型R1、多模态模型JanusPro。DeepSeek通过技术创新,降低大模型开发、部署成本,并通过开源策略降低了行业门槛,加速了技术迭代和生态建设。DeepSeek的成功,为中国AI产业的发展注入了新的活力。
民营企业:大模型应用的生力军
民营企业在推动人工智能发展上发挥着生力军作用。以360集团为例,其在大模型应用领域主要着力于赋能个人、赋能企业、赋能业务三方面。叶健表示,大模型的出现不意味着可以跳过数字化直接到智能化,但数字化的很多部分可以通过大模型得到很大优化,通过大模型也可以去调动原来的一些数字化系统,这些加起来可以让企业的生产力得到极大的提高。
总结
国内大模型领域呈现出百家争鸣的态势,商汤科技、首都在线、深度求索、DeepSeek等企业及研究机构在各自领域取得了显著成果。未来,随着大模型技术的不断发展和应用场景的不断拓展,国内大模型将引领AI新浪潮,为我国人工智能产业注入新的活力。