边缘端人工智能(AI)硬件凭借其低延迟、高能效和强隐私性等优势,得到广泛关注与应用。在功耗严格受限的边缘端部署AI硬件,不仅需要高能效以满足功耗约束,还需要高并行度以提升实时性能。基于阻变存储器(RRAM)的存算一体和近阈值计算作为两种高效能计算范式,有望在实现高能效、高并行的AI硬件中发挥关键作用。然而,受工艺波动的影响,这两种计算范式的规模与可扩展性仍面临挑战。此外,如何有效结合这两种范式以开发低功耗、高并行的AI硬件,目前仍缺乏深入研究。
针对上述挑战,中国科学院微电子研究所集成电路制造技术全国重点实验室科研团队设计并实现了一款基于近阈值计算的RRAM存算一体芯片。团队利用双晶体管单阻变存储器(2T1R)单元,将RRAM的阻变特性转化为阈值电压调控特性,提出RRAM-CMOS阈值电压失配抵消技术,有效抑制了长期困扰两种计算范式的工艺波动问题。针对网络模型多比特乘累加运算的需求,团队提出了基于电荷堆叠的新型电荷域计算技术,实现了一种采样、加权与量化一体化模数转换电路,显著降低了外围电路的功耗与面积开销。团队在多核存算一体系统中引入了核间混合精度控制技术,通过对神经网络各层数据特征进行分析,为每个计算核心配置优化的累加与量化方法,实现了任务级推理功耗的高效优化。
基于上述设计,团队成功流片验证了具有16个计算核心的近阈值RRAM存算一体芯片。该芯片可实现256通道累加的高并行模拟计算,平均相对标准差低至2.4%,计算能效可达55.21至88.51 TOPS/W。本研究展示了高能效、高并行近阈值RRAM存算一体技术,为边缘AI硬件的发展提供了新思路。
本研究以"A near-threshold memristive computing-in-memory engine for edge intelligence"为题发表在《Nature Communications》期刊(论文链接:https://www.nature.com/articles/s41467-025-61025-4)。微电子所博士毕业生王琳方博士,微电子所博士研究生李伟增及周治道为共同第一作者,微电子所窦春萌研究员为通讯作者。该研究得到了复旦大学、中国科学院计算技术研究所、中国科学院软件研究所等多个合作单位的大力支持与协作。
图1. (a)芯片显微照片、关键结构和近阈值计算方案;(b)RRAM-CMOS阈值电压失配抵消技术;(c)采样、加权与量化一体化模数转换技术;(d)核间混合精度控制技术。
相关新闻: |
微电子所在GaN外延位错传导载流子及其导致功率电子器件可靠性退化机制取得重要进展 |
微电子所两项研究工作入选2025年国际微波会议(IMS2025) |
微电子所在EUV光刻收集镜红外辐射抑制方面取得新进展 |
学习园地