1、 CPU将被人工智能浪潮终结? 冯诺依曼计算机架构与X86生态圈的发展,CPU被广为人知。CPU通过顺序执行指令完成逻辑运算,在通用桌面计算机和高端服务器中发挥着核心作用。Intel、AMD公司把握市场、技术的主导地位。 随着互联网数据的海量增长,移动应用、大数据、人工智能等新的应用兴起,在有限的成本和时间上,传统的CPU处理器架构已很难满足算力的需求。一种新的,具备大量数据并行计算、具备加速处理计算功能的芯片应运而生。各路传媒奔走相告,人工智能芯片即将颠覆CPU芯片,CPU计算架构将被终结。事实真是如此么? 2、 人工智能芯片的创新 笔者反复提及,人工智能具备三个要素:数据、算法、算力。人工智能芯片即是算力的保证。从人工智能的应用场景上来看,人工智能芯片可以分为三类:云端训练芯片、云端推断芯片、终端计算芯片。简而言之,人工智能先采用云端训练芯片对训练数据进行训练,得出核心的计算模型,再参与云端推断芯片根据计算模型对新数据进行判断推理得出结论。终端计算芯片主要提供简单的、或者需要实时性能的边缘计算的能力,比如自动驾驶的实时计算能力。 云端训练芯片方面,英伟达的显卡芯片因具备优越的浮点计算能力、并行计算能力,尤其适合人工智能训练场景的计算,再次获得技术的垂青,占据云端训练芯片的霸主地位。新进入到强力竞争者包括Google的TPU,谷歌定制化开发的TPU与TensorFlow完美结合,试图通过提高人工智能云算力的模式,撼动Nvidia的霸主地位。国内比特大陆的算丰TPU亦步亦趋,然而和国外头部企业相比,还有很大差距。 云端推断芯片方面,未有头部企业先行布局,芯片架构较为简单,因此各类企业纷纷进入这一领域,包括AMD、Intel、英伟达等传统芯片巨头,国内的百度等。比如百度的XPU,用于百度的人工智能、数据分析、云计算以及无人驾驶业务。 终端计算芯片方面,由于人工智能面向不同应用场景需要的算法大不相同,因此终端芯片特别需要针对不同的算法、不同的场景进行定制与优化。终端芯片可谓是百家齐放,各类独家兽企业纷纷进入这一领域,唯恐落后。移动计算芯片与自动驾驶芯片可以说是终端计算芯片两个主流应用场景。比如英特尔的Myriad X芯片用于无人机、智能相机和VR / AR头盔,实现在视觉设备上的计算加速。NVIDIA的Xavier芯片,用于增强现实(AR)技术与自动驾驶汽车。寒武纪的NPU用于智能手机、无人机、安防监控等终端设备。 3、 人工智能芯片与CPU的深度融合 综上所述,人工智能芯片突出特点在于算,大量数据的算、并行的计算。CPU的突出特点在于指令的执行,大量的指令高效的调度执行。随着人工智能技术的发展,单一的人工智能应用系统将逐步被淘汰。通用型的人工智能系统将逐步构建。 异构计算则是支撑起通用型人工智能计算技术的核心。异构计算的系统中包含了多种基于特定领域架构设计的微处理单元,每一个微处理单元负责某个独特领域,并在特定的领域优化。同时,异构计算系统能够进行高效的逻辑判断,区分不同领域的计算需求,将各个微处理单元进行统一调度,当遇到相关领域的计算时便由相应的领域的微处理单元负责计算。 科技的浪潮不断向前,CPU并不会被终结,而是在人工智能算力发展的大潮中不断演进,与人工智能芯片深度融合,支撑起更大规模、更通用的人工智能系统的算力需求。