邵广禄,中国电信科技委主任,近年来在数字发展论坛上发表了关于AI大模型的重要演讲,揭示了AI大模型在未来科技革命和产业变革中的关键作用。以下是对邵广禄演讲内容的详细解析。
AI大模型的发展背景
邵广禄指出,科技革命引发了全要素生产率(TFP)的快速提升,历史上蒸汽机、电力、IT互联网三次科技革命都产生了“蝴蝶效应”,推动了社会经济的巨大变革。如今,人工智能(AI)成为了新一轮科技革命的“蝴蝶”,预示着产业变革的到来。
AI大模型面临的挑战
在AI大模型的发展过程中,邵广禄强调,我们面临着高性能与异构算力、高质量数据集等挑战。中国电信在攻克这些技术难点方面做出了积极探索,如万卡集群线性加速、网络与调度能力、稳定性与故障恢复能力、并行资源调度能力等。
中国电信在AI大模型领域的布局
中国电信在AI产业早布局、快发展,全面布局AI大模型,持续攻克万卡算力、息壤算力调度平台、数据要素平台、星辰系列大模型以及行业大模型等核心技术。此外,中国电信还积极开源星辰大模型和开放中文数据集TeleChat-PTD,推动AI技术的普及和应用。
数据集的重要性
邵广禄指出,在人工智能由模型中心转向数据中心的过程中,数据集是大模型构建的基石。面对数据集构建中量不足、质不高、用不畅的三大挑战,中国电信在实践中总结出高质量数据集的生产是个系统工程,涉及以下六个方面:
- 数据底座:包含云、网、隐私计算等。
- 数据采集:当前网页数据比较成熟,但中文数据质量不高,特别需要生态合作开放数据集。
- 数据预处理和分级分类。
- 数据标注:需要产业化发展来提供更大范围更高质量的数据集。
- 预训练的配比。
- 高质量数据集的筛选。
AI大模型的应用案例
邵广禄分享了两个AI大模型的应用案例:
- 中国电信与温州医疗合作数据开放共享,通过AI质控提高图像质量,避免患者重复检查。
- 中国电信与中国联通通过5G共建共享合作实践,三年节省千亿数量级投资,每年节省百亿数量级运营成本。
AI大模型的共建共享
邵广禄提出,通过开源开放、共享资源、共享收益,减少企业重复建设和成本投入,促进数据集的共建共享,促进人工智能大模型的共建共享,通过AI和数据驱动加速高质量发展。
总结
邵广禄的演讲揭示了AI大模型在未来科技革命和产业变革中的重要作用。随着技术的不断突破与创新应用的持续拓展,AI大模型将在各行各业发挥更大的作用,推动社会经济的持续发展。
