范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

ChatGPT需要怎样的芯片?

  最近,以ChatGPT为首的生成类模型已经成为了人工智能的新热点,硅谷的微软、谷歌等都纷纷大举投资此类技术(微软100亿美元入股ChatGPT背后的OpenAI,谷歌也于近日发布了自研的BARD模型),而在中国以百度等为代表的互联网科技公司也纷纷表示正在研发此类技术并且将于近期上线。
  以ChatGPT为代表的生成类模型有一个共同的特点,就是使用了海量数据做预训练,并且往往会搭配一个较为强大的语言模型。语言模型主要的功能是从海量的现有语料库中进行学习,在经过学习之后可以理解用户的语言指令,或者更进一步根据用户的指令去生成相关的文字输出。
  生成类模型大致可以分成两大类,一类是语言类生成模型,另一类是图像类生成模型。语言类生成模型以ChatGPT为代表,如前所述其语言模型不仅可以学习理解用户指令的意义(例如,"写一首诗,李白风格的"),而且在经过海量数据训练之后,还能够根据用户的指令生成相关的文字(在上例中就是写一首李白风格的诗)。这意味着ChatGPT需要有一个足够大的语言模型(Large Language Model,LLM)来理解用户的语言,并且能有高质量的语言输出——例如该模型必须能理解如何生成诗歌,如何生成李白风格的诗歌等等。这也意味着语言类生成式人工智能中的大语言模型需要非常多的参数,才能完成这类复杂的学习并且记住如此多的信息。以ChatGPT为例,其参数量高达1750亿(使用标准浮点数的话会占用700GB的存储空间),其语言模型之"大"可见一斑。
  ChatGPT生成回答的一个例子,支持中文
  另一类生成类模型是以扩散模型(Diffusion)为代表的图像类生成模型,典型的模型包括来自OpenAI的Dalle,谷歌的ImaGen,以及目前最热门的来自Runway AI的Stable Diffusion。这类图像类生成模型同样会使用一个语言模型来理解用户的语言指令,之后根据这个指令来生成高质量的图像。与语言类生成模型不同的是,这里使用到的语言模型主要用语理解用户输入,而无需生成语言输出,因此参数量可以小不少(在几亿数量级),而图像的扩散模型的参数量相对而言也不大,总体而言参数量大约在几十亿数量级,但是其计算量并不小,因为生成的图像或者视频的分辨率可以很高。
  图像生成模型生成的图像一例
  生成类模型通过海量数据训练,可以产生前所未有的高质量输出,目前已经有了不少明确的应用市场,包括搜索、对话机器人、图像生成和编辑等等,未来可望会得到更多的应用,这也对于相关的芯片提出了需求。
  生成类模型对于芯片的需求
  如前所述,以ChatGPT为代表生成类模型需要在海量的训练数据中进行学习,才能实现高质量的生成输出。为了支持高效率训练和推理,生成类模型对于相关芯片也有自己的需求。
  首先就是对于分布式计算的需求。ChatGPT这类语言类生成模型的参数量高达千亿,几乎不可能使用单机训练和推理,而必须大量使用分布式计算。在进行分布式计算时,对于机器之间的数据互联带宽,以及计算芯片对于这类分布式计算(例如RDMA)就有了很大的需求,因为很多时候任务的瓶颈可能并不在计算,而是在数据互联上面,尤其是在此类大规模分布式计算中,芯片对于分布式计算的高效率支持更加成为了关键。
  其次是内存容量和带宽。虽然对于语言类生成模型分布式训练和推理不可避免,但是每个芯片的本地内存和带宽也将很大程度上决定单个芯片的执行效率(因为每个芯片的内存都被使用到了极限)。对于图像类生成模型来说,可以把模型(20GB左右)都放在芯片的内存中,但是随着未来图像生成类模型的进一步演进,它对于内存的需求可能也会进一步提升。在这个角度来看,以HBM为代表的超高带宽内存技术将会成为相关加速芯片的必然选择,同时生成类模型也会加速HBM内存进一步增大容量和增大带宽。除了HBM之外,CXL等新的存储技术加上软件的优化也有将在这类应用中增加本地存储的容量和性能,估计会从生成类模型的崛起中获得更多的工业界采用。
  最后是计算,无论是语言类还是图像类生成类模型的计算需求都很大,而图像类生成模型随着生成分辨率越来越高以及走向视频应用,对于算力的需求可能会大大提升——目前的主流图像生成模型的计算量在20 TFlops左右,而随着走向高分辨率和图像,100-1000 TFLOPS的算力需求很有可能会是标准。
  综上所述,我们认为生成类模型对于芯片的需求包括了分布式计算,存储以及计算,可谓是涉及了芯片设计的方方面面,而更重要的是如何把这些需求都以合理的方法结合到一起来确保某一个单独的方面不会成为瓶颈,这也将会成为一个芯片设计系统工程的问题。
  GPU和新AI芯片,谁更有机会
  生成式模型对于芯片有了新的需求,对于GPU(以Nvidia和AMD为代表)和新AI芯片(以Habana,GraphCore为代表),谁更有机会能抓住这个新的需求和市场?
  首先,从语言类生成模型来看,由于参数量巨大,需要很好的分布式计算支持,因此目前在这类生态上已经有完整布局的GPU厂商更有优势。这是一个系统工程问题,需要完整的软件和硬件解决方案,而在这个方面,Nvidia已经结合其GPU推出了Triton解决方案。Triton支持分布式训练和分布式推理,可以把一个模型分成多个部分到不同的GPU上去处理,从而解决参数量过大一个GPU的主存无法容纳的问题。未来无论是直接使用Triton,还是在Triton的基础上做进一步开发,都是拥有完整生态的GPU更加方便一点。从计算上来看,由于语言类生成模型的主要计算就是矩阵计算,而矩阵计算本身就是GPU的强项,因此从这一点来看新的AI芯片相比GPU的优势并不明显。
  从图像类生成模型来看,这类模型的参数量虽然也很大但是比语言类生成模型要小一到两个数量级,此外其计算中还是会大量用到卷积计算,因此在推理应用中,如果能做非常好的优化的话,AI芯片可能有一定机会。这里的优化包括大量的片上存储来容纳参数和中间计算结果,对于卷积以及矩阵运算的高效支持等。
  总体来说,目前这一代AI芯片在设计的时候主要针对的是更小的模型(参数量在亿级别,计算量在1TOPS级别),而生成模型的需求相对而言还是比原来的设计目标要大不少。GPU在设计时以效率为代价换取了更高的灵活度,而AI芯片设计则是反其道而行之,追求目标应用的效率,因此我们认为在未来一两年内,GPU仍将会在此类生成式模型加速中独占鳌头,但是随着生成式模型设计更加稳定,AI芯片设计有时间能追赶上生成式模型的迭代后,AI芯片有机会从效率的角度在生成式模型领域超越GPU。

为老读天下丨西湖游船特色夜游上线,首轮开放两条线路西湖游船特色夜游上线,首轮开放两条线路来自周到00000056据微信公众号西湖游船公司消息,2023年西湖游船特色夜游于昨晚(3月27日)惊喜上线,与往年相比,今年的夜游开启时间,新康养观察人民公园中新康养人群姿势大赏不逛人民公园,你根本不了解新康养人的日常生活。如今的人民公园已不再只有公园的属性,它是集城市发展老年社交人文交流休闲娱乐运动健身为一体的生态场所,同时也是城市快速发展的最新印证。当海南未来的发展机会在哪里?一条百赞线告诉你如何做选择头条创作挑战赛儋州海南建设自由贸易港,意味着未来重要的发展机会,是面向全世界的发展自由贸易。这是最简白明最核心最重要的道理。全世界任何一个自由贸易港,它的农业和它的旅游业,都不再是安徽芜湖金色花海美乡村来源新华网3月27日拍摄的峨桥镇响水涧村的油菜花田(无人机照片)。近日,安徽省芜湖市三山区峨桥镇响水涧村的油菜花迎来盛花期。金黄的油菜花田错落有致分布于乡间水道旁,形成一幅幅美丽的看不见的福田那些习以为常的,往往弥足珍贵譬如大地,大地就像是一片巨大的魔法毯,投予一粒小小的种子,它所变化出来的常常是难以计量的。大地这块魔法毯,不同区域有着不同的魔法。地球上某些大地独特而神销量下滑谁之过?溃堤般优惠过后沃尔沃XC90能否重回巅峰?大家好,我坐过一个合作伙伴的这代XC90几回,后来去当地4S店,试驾了这代的XC90。先说下题主的问题,XC90在我的印象里似乎没有过销量和口碑的巅峰吧?和主流的一些车比起来其实销微波炉和烤箱哪个更实用?微波炉和烤箱哪个更实用?相信付出爱是让自己幸福的最好方式,深深地相信,美食是抚慰人心的不二法门,更多美食问答,请关注觅源良食,让我们给您答疑解惑!三年前,家里的微波炉坏了,爸妈在吃安庆有哪些好吃的小吃?大家好,我是尹小厨,很高兴能为你解答这个问题。安庆又叫宜城,是安徽省的旧省会,后来由于政治原因省会迁往合肥,安庆的美食自古闻名,油酥饼江毛水饺鸡汤炒米山粉丸子大关水碗等特色美食让人十年后比特币价格是多少?今年2月特斯拉花了15亿美元买比特币。埃隆马斯克发文说比特币差不多就是法定货币。这下把比特币拉上了58000美元的历史新高。今年全球首只比特币ETF在加拿大获批上市。美联储主席鲍威中国移动的流量资费是不是太贵了?感谢邀请,我来给大家解答这个问题!中国移动在有段时间内确实推出过1元1G的流量套餐,但是没多久就取消了这个套餐,平心而论,这个套餐的推出还是满足了部分客户的实际需求的,但是对于大流我的上海故事我和我的上海好朋友在整个接待服务过程中,让游客感到贴心舒心暖心是我坚持这项工作的最大动力。全国人大代表浙江舟山旅游集团普陀山旅行社导游员谢丽如是说,不少游客多次来普陀山继续找我陪同叙旧,更多老客人见
男生感觉到最ampampquot爽ampampquot的9件事(女生勿进)头条创作挑战赛导语曾经的少年已过去,再也不会有年少,年少不知烦苦累,待到成人事事都在催。男生感觉爽的事都会有哪些呢!当还在少年的时代我们会没有烦恼活泼天真,那时候童年的时光,放假时专访巫鸿记忆写作关系到感觉,而不是真实事件巫鸿,美术史家艺评家策展人,美国文理学院院士。1963年考入中央美术学院,19721978年任职于故宫博物院书画组金石组,1978年重返中央美术学院美术史系攻读硕士学位,19801马伊琍紧穿皮裙满是褶皱,身材凸显太过明智在影视圈中,众多女明星都在追求美瘦的苗条身材,显得庄重且好看。当马伊琍参加年度最具影响力演员的颁奖晚会时,身穿皮裙满是褶皱,显露身材太过明智。俗话说得好只要自己不尴尬,尴尬的就是别50岁徐峥现身片场,肥头大耳大腹便便,突然感觉配不上小陶虹了10月27日,徐峥现身新戏片场,画面中徐峥依旧像往常一样光着圆圆的脑袋,脸看起来胖了不少,只见他身穿一件灰色外套和黑色裤子搭配花色运动鞋。画面中徐峥看起来油腻了不少,肥头大耳,大腹关辛赛后马尚郁闷地独自一人走回更衣室胡明轩肯定会非常自责直播吧10月30日讯CBA常规赛,广东9697不敌浙江。赛后,广东队随队记者关辛更新社媒写道还能说什么呢?被自己最擅长的紧逼给击败,最后关键的两次失误,到手的胜利丢了。比赛结束后马阴森恐怖韦布望远镜拍摄的万圣节版创生之柱中红外波段上的创生之柱。中红外波段上的创生之柱。JWST近日韦布望远镜发布了第二张创生之柱(或称创世之柱)照片。与第一张近红外照片不同,这张照片是在中红外波段上拍摄的,加之采用了不11月将上演红月天象在即将到来的11月,将有一次精彩的月全食天象上演,我国大部分地区人们都可以看到月全食的全食阶段,也就是红月亮,越往东部地区,观测条件越好。记者从北京天文馆获悉,这次月全食的初亏将发我国成功布设海底实验站将实现深海长周期无人科考记者28日从中国科学院获悉,探索二号科考船携深海勇士号载人潜水器完成一系列海试任务,已于日前返回三亚。海试期间,科研人员成功在海底布设大深度原位科学实验站,将实现深海长周期无人科考多款华为PC双11钜惠4K价位唯一2K触屏全能本不容错过最近这段时间,双11活动已经正式开启了,每年的双11其实都是各大电商平台和各大厂商优惠力度最大的时候,也是用户们最喜欢的时候,可以以更低的价格买到自己喜欢的产品,基本都会早早挑选好双11捡漏大队,性价比真的高,你不该错过的三款数码好物就算再穷,今年的双十一我还是凑了波热闹,毕竟都是真金白银降下来的价格,不买实在对不起自己,所以很多日用品这些都是一买买一年的量,但是这些产品是不是真降还是套路,我是凑个热闹也没心思小米因软件系统架构调整,MIUI开发版自10月31日起暂时停更IT之家10月28日消息,小米今天推送了MIUI13的V13。1。22。10。24。DEVV13。1。22。10。25。DEV开发版,并宣布将于10月31日开始停版一段时间。对于此