随着人工智能技术的飞速发展,大模型在各个领域展现出巨大的潜力。国内的大模型研发也取得了显著成果,本文将为您一网打尽国内大模型领域的最新动态。
1. 智谱AI发布新一代基座大模型GLM-4-Plus
智谱AI在ACM SIGKDD(国际数据挖掘与知识发现会,KDD)上发布了新一代基座大模型GLM-4-Plus,该模型在语言理解、指令遵循、长文本处理等方面性能得到全面提升,达到了国际领先水平。
语言能力
GLM-4-Plus通过大量模型辅助构造高质量合成数据以提升模型性能,利用PPO有效提升模型推理表现。在各项性能指标上,GLM-4-Plus已达到与GPT-4o等第一梯队模型持平的水平。
长文本能力
GLM-4-Plus在长文本处理能力上比肩国际先进水平。通过更精准的长短文本数据混合策略,显著增强了长文本的推理效果。
2. 阶跃星辰发布Step-1o系基座模型全家桶
阶跃星辰一口气连更上新6款模型,涵盖语言、语音、推理到多模态理解和生成,成为业内公认的“多模态卷王”。
Step-1o Vision
Step-1o Vision是阶跃星辰的视觉版本多模态模型,在视觉识别、感知、指令跟随、推理等核心能力上都有大幅提升。该模型在LMSYS Org最新发布的大模型竞技场Chatbot Arena多模态榜单中,位列视觉领域中国大模型第一。
3. 声网Agora助力实时互动
声网Agora作为国内实时互动领域的头部公司,与OpenAI在2024年10月份开发者日上公布的语音API合作者中,其兄弟公司Agora名列其中。Agora聚焦美国和国际市场,为实时音视频互动提供支持。
实时语音互动
声网Agora通过应用RTE(实时互动)技术,实现了语音的实时传输,进一步降低了语音交互的延时,成为人与AI交互的重要一环。
4. 快手推出AI创意生产力平台可灵AI
快手推出了新一代AI创意生产力平台——可灵AI,目前在技术、用户、生态等方面均处于全球领先地位。可灵AI通过视频生成技术为创作者提供了高效、便捷的创作工具。
可灵AI导演共创计划
可灵AI联合李少红、贾樟柯等9名知名导演共同发起了可灵AI导演共创计划,推动AIGC在内容创作中的应用。
5. 深度求索发布NSA(原生稀疏注意力)机制
深度求索发布了NSA(原生稀疏注意力)机制,旨在解决标准注意力机制的高计算成本带来的挑战。NSA在提高效率的同时,为提高模型能力提供新的方向。
NSA的优势
NSA采用动态分层稀疏策略,通过算术强度平衡算法设计实现了显著的加速,并针对现代硬件进行了实现优化。实验表明,使用NSA预训练的模型在一般基准、长上下文任务和基于指令的推理中保持或超过了全注意力模型。
总结:国内大模型领域在不断发展,各大公司纷纷推出具有创新性的大模型产品。未来,随着技术的不断进步,大模型将在更多领域发挥重要作用。