随着人工智能技术的飞速发展,大模型成为了国内外科技巨头竞相追逐的焦点。国内在人工智能领域也取得了一系列突破,然而,关于这些大模型是真正的技术突破还是仅仅套壳模仿,一直存在着广泛的讨论。本文将深入剖析这一话题,探讨国内大模型的发展现状及其背后的技术路径。
一、国内大模型的发展背景
近年来,国内人工智能领域的发展势头迅猛。从政策层面,我国政府高度重视人工智能的发展,出台了一系列支持政策,为人工智能产业提供了良好的发展环境。从技术层面,国内科研机构和企业在人工智能领域投入巨大,取得了一系列重要成果。
二、技术突破:以“陆兮科技”为例
国内一些企业开始探索非T架构研发,并在技术、产业、应用与合规层面实现突破。以“陆兮科技”为例,该公司专注于从零开始搭建自研类脑架构的大模型。类脑大模型采用了模仿人脑结构和功能的类脑算法路线,与传统的Transformer架构相比,具有更高的运算与存储效率。
1. 类脑架构的优势
类脑架构在运算时采用稀疏计算机制,仅需调取与当次计算直接相关的神经元,其余闲置神经元均处于休眠状态。在存储时,人脑无需重复翻书,对比新旧数据时只需调用高保真压缩后的记忆体,信息本身则处于隐状态中。
2. NEURARK类脑架构
“陆兮科技”提出的NEURARK类脑架构,通过复刻人类大脑高保真、轻量化、低功耗、零延迟的运算与存储机制,通过简化底层运算机制,运用点乘加法等低能耗运算,来替代矩阵乘法的高能耗预算模式。
三、套壳模仿:以“DeepSeek”为例
然而,也有观点认为,国内一些大模型仅仅是套壳模仿。以“DeepSeek”为例,该公司推出的新一代大模型R1,性能比肩OpenAI GPT-1正式版的同时,实现了超低训练成本,并且全面开源。
1. 无监督强化学习训练体系
“DeepSeek”选择了一条迥异于传统巨头的技术路径:开创性地构建了无监督强化学习训练体系,降低对人工标注数据的依赖,让算法在自我博弈中激活推理潜能。
2. 成本控制能力
“DeepSeek”团队仅用不到600万美元便完成DeepSeek-V3(2024年12月发布)的训练,据测算成本仅为美国同类模型的十分之一左右。
四、结论
总体来看,国内大模型的发展既有技术突破,也存在套壳模仿。在技术突破方面,类脑架构等创新技术为我国人工智能领域带来了新的发展机遇;在套壳模仿方面,国内企业通过借鉴国外先进技术,降低了研发成本,加快了产品迭代速度。
未来,国内大模型的发展需要在技术创新和产业应用两个方面持续发力,以实现从模仿到超越的跨越。
