王振兴课题组在高精度神经网络计算硬件方面取得重要进展

发布时间:2025-03-25

    随着计算机视觉和人工智能技术的快速发展,图像采集终端产生的海量数据需要通过神经网络进行智能化处理,即机器视觉系统。传统成像系统的“探测—计算—存储”架构存在高冗余、高能耗、高时延等问题,难以满足新型机器视觉的需求。通过模拟生物视觉系统特性的智能成像系统,其前端探测单元将传感与计算一体化集成(感算一体),后端计算单元测将存储与计算功能融合(存算一体)。这种成像架构能有效减少数据冗余、降低能耗及时延,为构建高效机器视觉系统提供了创新解决方案。

    在此背景下,王振兴研究团队长期致力于基于感算融合架构的智能机器视觉系统开发。面向前端传感单元,研究团队设计并构建了一种基于“可重构正负光伏响应”机制的新型感算融合器件。基于该机制,团队针对不同应用场景创新开发了多类神经形态光电传感器:(1)针对图像空间信息,通过范德华异质集成构建了三维多层卷积核阵列,实现了多核并行的“感内卷积计算”,较传统串行过程缩短78%计算时间(Nano Lett. 2023,23,4524);(2)针对图像偏振信息,开发了感内偏振图像卷积技术,显著提升了复杂环境下的目标识别准确率(Adv. Mater. 2025,2420333. DOI: 10.1002/adma.202420333);(3)针对动态信息,开发了光响应可调的双极图像传感器,通过背景差分法有效扣除了静态背景信息,显著减少了冗余数据的传输(Nano Lett. 2024,24,5862)。

    最近,面向后端计算单元,王振兴研究团队创新性地开发了一种8-bit精度的新型卷积神经网络硬件,其核心器件采用栅极与沟道共面且共享阻挡层/隧穿层的平面浮栅存储器结构。基于该结构,研究团队提出了一种双脉冲编辑存储状态的新策略,在国际上首次解决了浮栅存储器中因界面态引起的状态弛豫问题,成功实现了8-bit(256态)高度可区分(间隔>3σ)且高度稳定的非易失电导态。该器件在16×16阵列中展现出94.9%的高良率,阵列器件性能显示出很好的一致性。基于此,研究团队在9×2集成阵列上进行了图像卷积运算,完成了38592个卷积核参数的精确映射,结果与仿真结果高度吻合。特别地,基于该硬件的8-bit固定精度的神经网络推理准确度接近理想值。相关成果发表于Nat. Commun. (2025,16,2649

    国家纳米科学中心博士生蔡宇晨为文章第一作者,王振兴研究员和王峰副研究员为通讯作者。该工作得到了武汉大学尹蕾研究员、何军教授的合作支持。该论文感谢国家自然科学基金、科技部重点专项、中国科学院青促会等项目的资助。


图:(a)栅极注入模式浮栅存储器结构。(b)8位多态稳定存储(左)和超过3倍标准偏差(3σ)的状态间隔(右)。(c)规模化制备的器件阵列。(d-e)集成器件阵列的硬件芯片(d)、芯片卷积运算输出与软件模拟结果对比(e)。


    文章链接:https://www.nature.com/articles/s41467-025-58005-z