揭秘国内大模型：是技术突破还是套壳模仿？

随着人工智能技术的飞速发展，大模型成为了国内外科技巨头竞相追逐的焦点。国内在人工智能领域也取得了一系列突破，然而，关于这些大模型是真正的技术突破还是仅仅套壳模仿，一直存在着广泛的讨论。本文将深入剖析这一话题，探讨国内大模型的发展现状及其背后的技术路径。

一、国内大模型的发展背景

近年来，国内人工智能领域的发展势头迅猛。从政策层面，我国政府高度重视人工智能的发展，出台了一系列支持政策，为人工智能产业提供了良好的发展环境。从技术层面，国内科研机构和企业在人工智能领域投入巨大，取得了一系列重要成果。

国内一些企业开始探索非T架构研发，并在技术、产业、应用与合规层面实现突破。以“陆兮科技”为例，该公司专注于从零开始搭建自研类脑架构的大模型。类脑大模型采用了模仿人脑结构和功能的类脑算法路线，与传统的Transformer架构相比，具有更高的运算与存储效率。

类脑架构在运算时采用稀疏计算机制，仅需调取与当次计算直接相关的神经元，其余闲置神经元均处于休眠状态。在存储时，人脑无需重复翻书，对比新旧数据时只需调用高保真压缩后的记忆体，信息本身则处于隐状态中。

“陆兮科技”提出的NEURARK类脑架构，通过复刻人类大脑高保真、轻量化、低功耗、零延迟的运算与存储机制，通过简化底层运算机制，运用点乘加法等低能耗运算，来替代矩阵乘法的高能耗预算模式。

然而，也有观点认为，国内一些大模型仅仅是套壳模仿。以“DeepSeek”为例，该公司推出的新一代大模型R1，性能比肩OpenAI GPT-1正式版的同时，实现了超低训练成本，并且全面开源。

“DeepSeek”选择了一条迥异于传统巨头的技术路径：开创性地构建了无监督强化学习训练体系，降低对人工标注数据的依赖，让算法在自我博弈中激活推理潜能。

“DeepSeek”团队仅用不到600万美元便完成DeepSeek-V3（2024年12月发布）的训练，据测算成本仅为美国同类模型的十分之一左右。

总体来看，国内大模型的发展既有技术突破，也存在套壳模仿。在技术突破方面，类脑架构等创新技术为我国人工智能领域带来了新的发展机遇；在套壳模仿方面，国内企业通过借鉴国外先进技术，降低了研发成本，加快了产品迭代速度。

未来，国内大模型的发展需要在技术创新和产业应用两个方面持续发力，以实现从模仿到超越的跨越。