解码未来存储：揭秘大模型时代芯片的多样面貌

引言

随着人工智能（AI）的快速发展，特别是大模型的兴起，数据量和计算需求呈指数级增长。这为芯片设计和存储技术带来了前所未有的挑战。本文将深入探讨大模型时代下，存储架构的变革、芯片技术的多样性以及未来存储解决方案的展望。

在大模型时代，传统的计算架构金字塔已经无法满足需求。为了解决“存储墙”问题，存内计算（In-Memory Computing，IMC）成为突破瓶颈的关键技术。本文将介绍如何扩展传统的计算架构金字塔，形成适应大模型时代的CIM（Computing-In-Memory）金字塔。

计算密集型CIM主要基于SRAM和eDRAM，适用于计算强度大的操作，如卷积、矩阵乘法等。这类存储介质具有高速、低延迟的特点，能够显著提高计算效率。

存储密集型CIM主要基于DRAM和NVM，适用于数据访问频繁的操作，如激活函数、解码器操作等。这类存储介质能够提供大容量存储，同时保持较低的功耗。

近年来，国内外关于计算密集型CIM和存储密集型CIM的研究取得了显著进展。以下将介绍几种典型的实现方式：

SRAM-CIM具有高速、低功耗的特点，但成本较高。适用于对计算速度要求较高的场景。

eDRAM-CIM结合了DRAM和SRAM的优点，具有较低的功耗和较高的带宽。适用于中等计算强度和存储容量的场景。

DRAM-PIM通过将计算单元集成到DRAM芯片中，实现了存储与计算的紧密耦合。适用于对存储容量和计算速度都有较高要求的场景。

NVM-PIM利用新型非易失性存储器（NVM）实现存储与计算的融合，具有较低的功耗和较长的寿命。适用于对存储寿命和功耗要求较高的场景。

为了满足大模型计算和存储访问的双重需求，本文提出了一种计算密集型CIM与存储密集型CIM异构融合架构。该架构能够根据不同任务的需求，动态调整计算和存储资源的分配，从而实现高效、低功耗的运行。

大模型时代对存储技术和芯片设计提出了新的挑战。通过扩展计算架构金字塔，引入存内计算技术，以及实现异构融合架构，我们可以更好地应对这些挑战，推动AI技术的进一步发展。未来，随着存储技术的不断创新，我们期待看到更多高效、低功耗、高性能的存储解决方案出现。