南大王欣然与清华吴华强团队合作发Nature子刊
近日,南京大学 王欣然 教授团队与清华大学 吴华强 教授团队合作,提出基于二维半导体铁电晶体管的新型存内计算器件架构,通过调节铁电势阱,实现了同时满足AI训练和推理需求的底层器件,并展示了 高达10³ TOPS/W级别的能效潜力。该成果突破了边缘端人工智能硬件的关键瓶颈之一。 成果以「An in-memory computing architecture based on a duplex two-dimensional material structure for in situ machine learning」为题,于2023年3月20日在线发表于 Nature Nanotechnology 。
该工作由南京大学、南京邮电大学、苏州实验室、清华大学、香港理工大学等单位合作完成。南京大学王欣然 教授、南京邮电大学于志浩 教授、清华大学高滨 副教授和吴华强 教授为论文的共同通讯作者 ,南京大学博士生宁宏凯 、温恒迪 、南京邮电大学于志浩 、清华大学张清天 工程师和高滨为论文的共同第一作者。
研究背景
AI (人工智能)的历史,可以归纳为软件和硬件的协同发展史,即「强大硬件推动软件发展」 和「复杂软件催生硬件革命」 的交替迭代。如今,我们正处在「软催硬」的周期内。以最近大热的现象级AI应用ChatGPT为例,其算力可以达到每秒10¹⁹次计算操作(即10⁷ TOPS),而维持其夸张算力的基础是上万块最先进的GPU以及77,160 kWh日耗电量——超过了全球40%国家的日发电量!因此,基于冯诺依曼架构的GPU硬件将难以支撑AI技术的可持续性发展。 实际上,人脑算力与GPT相当,功耗却仅为20W,能效比GPT采用的GPU高5个数量级。因此,发展高能效的类脑计算器件和架构 势在必行。
研究进展
图1 训练-推理一体化更接近人脑的计算方式
受大脑存算一体特征的启发,存内计算架构近年来蓬勃发展,显著降低了「冯诺依曼」架构中数据传输的能耗与延迟,大幅提高了计算并行度和能效。在此基础上,更高维度的需求——训练和推理一体化 ,即「学」和「用」在同一硬件上实现(如图1所示的主动学习能力),被认为是通向智慧终端的核心挑战。
图2 推理和训练过程对于存储器性能的不同要求
其中的瓶颈就在于,推理和训练过程对于存储器硬件本身的要求截然不同。 从物理本质上看,两者好似鱼和熊掌一般不可兼得。 如图2所示,推理的实际过程,是数据在权重矩阵中做批量的乘加运算,它要求存储器具有高势垒,器件上体现为长久的数据保持(Long data retention),而不需要有很高精度的多态(Multi-state);而训练过程,则是对权重矩阵中每一个节点进行更新,这要求存储器具有较低的势垒,器件上体现为极高的耐久性(High endurance)、极快的操作速度(High speed)和较小的翻转功耗(Low switch energy)。长久以来,由于这种制衡关系的存在,大家难以找到一种普适的存储器 来实现训练-推理一体,这严重制约了AI硬件的发展。
图3 满足训练-推理一体的复式器件结构
在这项工作中,研究人员巧妙利用了铁电材料能量双阱曲线的可调性,并从「材料-物理-器件-电路-系统」 的层面,逐级证明了这种可调性设计用于训练-推理一体特征的可行性。研究人员提出了一种「复式(Duplex)」的二维半导体铁电晶体管结构(如图3所示),通过设计浮栅两侧铁电电容和介电电容的面积比例(Aғᴇ/Aᴅᴇ),调控了铁电两端的分压比例,从而实现了对铁电能量双阱曲线的形态调节。 Aғᴇ /Aᴅᴇ 较大的栅极,能垒较低、铁电部分翻转、翻转功耗低(22.7 fJ/(bit μm²))、速度快(<4.8ns)、耐久性高 (>10¹³次翻转),更适合用于AI训练;而Aғᴇ /Aᴅᴇ 较小的栅极,能垒较高、铁电翻转较为彻底、数据保持长久(10年),适合用于AI推理。
图4 基于TIIO阵列的原位训练和推理演示
在电路层面(如图4所示),研究人员使用1个复式结构和2个开关晶体管组成了2T-1D的训练推理一体(Training-Inference-In-One, TIIO)单元,单元之间通过行列线组成crossbar结构的阵列,该阵列可以实现全模拟(即输入信号未通过数字化)的非线性分类任务。其中的训练和推理,都在同一硬件中原位完成,分别实现了100%的训练精确度和99.86%的推理精确度。所演示的单元设计和操作时序,原则上适用于任意结构和种类的神经网络。
在系统层面,我们基于对边缘智能的主流应用场景之一——自动驾驶,通过仿真演示了TIIO架构在单目深度识别中的成功应用。该架构在计算精度媲美GPU的前提下,显著提高了能效。在22nm先进节点下,TIIO核心阵列的能效极限可达1151 TOPS/W(训练)和111.86 TOPS/W(推理)。
面向未来,研究人员提出的TIIO架构旨在实现无云端依赖的边缘智能(Edge intelligence) ,即具有本地学习、快速决策、数据安全、低能耗和高能效的「更加聪明的终端」 。另外,由于其集成工艺与CMOS工艺兼容,可以与硅基电路异质集成,构建面向原位学习的三维集成电路。最后,该架构还将促进迁移学习(Transfer learning) 和终身学习(Lifelong learning) 等核心AI方法和场景的深入发展。
该研究得到了国家自然科学基金、国家重点研发计划、江苏省前沿引领技术基础研究专项等经费资助,以及南京大学微制造与集成工艺中心的工艺支持、北京市未来芯片技术高精尖创新中心的仿真支持。
论文链接:
https://www.nature.com/articles/s41565-023-01343-0
--南京大学
文旅局长立功了!春游热潮带动网约车订单翻番一边是各地的文旅局长积极为当地旅游带货,另一边是春暖花开桃红柳绿,各地不仅迎来了春游的热潮,同时也带动了出行市场的热度。近日哈啰打车发布的最新数据显示,3月以来,平台内的出行需求持
缅北果敢缅甸领土最近疫情放开管控,出境旅游有望恢复,提起出境旅游,东南亚一直是国人最热衷的地点之一,但如果你问要出境游的人是去哪一个东南亚国家,十有八九是会说是新加坡马来西亚泰国或者印尼越
海丰县被列为省级休闲农业与乡村旅游重点县近日,广东省农业农村厅广东省文化和旅游厅公布2022年度省级休闲农业与乡村旅游示范单位,确定4个县(市区)为2022年度省级休闲农业与乡村旅游重点县,其中海丰县为全省四个获此殊荣的
旅途(三)那一日去深圳福田拜访客户,客户办公地点离地铁口有一段距离,我喜欢走路,照例没有叫车,过去差不多一公里,快到目的地的时候,有座人行过街天桥,天桥楼梯下的空档处,在四层楼高景观树的阴影
西北小伙穷游自驾到云南昭通了Day13。晴190km水城区威宁县昭阳区难得早起一会,但早起也没啥好事,吃的脆哨面真想来个摔碗面,紧接着陡坡停车场熄火倒车刮了车。一直都是加中石油的油,跑过去加油站文涛兄看到旁边
宋美龄承认自己确实是个笨蛋杨雨青本文刊载于作家文摘第2608期04版宋美龄早期书信中的婚恋观文杨雨青宋美龄8岁时到美国读书,14岁后进入名校韦斯里学院,据教过宋美龄的教授回忆,美龄有很多的倾慕者。1917年
三边英雄谱刘汉鼎六十年革命生涯(十)司法工作经验谈我从一九四年九月在清涧县担任审判员起,先后担任过固临县审判员。陕甘宁边区高等法院典狱长。审判员(推庭)巡回法庭庭长。安边县司法处长。宁夏省(当时宁夏没有成立自治区)高
如果三国时,曹操没有杀华佗,他的开颅手术能成功吗?华佗是谁?明人绘制的华佗像在三国时期,华佗是一位非常著名的医学家和外科医生。据说他在治疗疾病方面非常有成就,同时也擅长手术。华佗(145年208年),字元化,名旉(读音同敷),沛国
百岁老人马寅初计划生育的先驱者,却因生下8位子女被诟病至今计划生育是世人皆知的基本国策,通过倡导晚婚晚育少生优生来控制人口,有效缓解了我国资源环境的压力,对国家的复兴崛起有着积极正面的作用。马寅初,是中国著名的医学家和生殖学家,被誉为中国
医学奇迹,秘鲁女孩五岁产子,孩子父亲至今成谜!1939年9月23日,秘鲁的Ticrapo镇上,一场医学奇迹诞生了。当时,一个年仅五岁的女孩丽娜梅迪纳(LinaMedina)成功地生下了一个健康的男婴,这个事件震惊了世界。几十年
地球文明的出现,是必然的?还是偶然的?地球文明的出现是人类历史上最迷人最复杂的现象之一。虽然有些人可能会争辩说,在适当的条件下,文明的发展是不可避免的,但另一些人则认为,文明的发展只是偶然的,是各种幸运环境共同作用的结