范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

2023炼丹GPU选购指南来了英伟达3080和4070Ti成性价比之王

  Alex 发自 凹非寺
  量子位 | 公众号 QbitAI
  春暖花开,各位深度学习er想不想给自己的"丹炉"升级一波?
  "炼丹"爱好者们应该知道,在该领域中,**GPU的总体表现完胜CPU。
  那么GPU应该怎么选?不妨来看看这篇超级详尽的"2023版GPU选购指南" 。
  知名测评博主、华盛顿大学在读博士Tim Dettmers亲测后,写下万字长文,手把手教你Pick性价比最高的显卡 ,避免踩雷。
  △光是目录就有这么长……
  至于谁是性价比之王,不卖关子,这里先放上Tim哥的结论:
  对于16位训练过程, RTX 3080 的性价比最高;对于8位和16位推理,RTX 4070Ti 的性价比最高。
  有意思的是,不只这俩,他在本文推荐的显卡全是英伟达家的 ——Tim哥觉得,对于深度学习,"AMD GPU+ROCm"目前还打不过"NVIDIA GPU+CUDA"。
  手把手教你挑GPU
  Tim哥自制了一张表格,展示出在训练和推理过程中,一美元能买到多少算力;这在一定程度上体现了英伟达众显卡的性价比。
  △ 蓝色-16位训练;红色-16位推理;黄色-8位推理
  看到这个,你可能一脸问号:从表格来看,不是RTX 4080在8位和16位推理上的性价比更高吗?
  其实,咱们开头说的是"综合性价比"——
  除了看一美元能买多少算力,还要结合显卡的运行成本,比如电费。所以总的来说,还是RTX 4070Ti的性价比更高。
  虽然RTX3080和RTX 4070 Ti性价比高,但这俩的内存是个明显短板 :
  Tim哥指出,12GB在很多情况下都不够用,要运行Transformer模型的话,至少需要24GB。
  于是,Tim哥又贴心地做了一个小程序,帮你根据不同的任务选择最合适的GPU。
  其背后的核心思想是:不管干啥,一定要保证GPU的内存满足你的需求。
  首先,要弄清楚这个GPU是个人用还是公用,还有就是要处理什么任务——比如,是要训练语言大模型(LLM) 吗、参数量有没有超过130亿?还是就做点小项目?
  然后再根据自己的钱包情况,参考上面的表格,选择最合适的GPU。
  举个例子:
  如果要训练LLM且参数量超过130亿,不差钱的可以选择支持Azure公有云的A100或者H100;追求性价比的话,可以选支持AWS的A100或者H100。
  但如果预算实在有限,建议放弃……
  (在亚马逊上,40GB的英伟达Tesla A100售价为11769美元起,约合人民币79529元。当然这都是针对国外的情况,在国内炼丹仅供参考)
  另外,Tim哥还支了一招:最好用云GPU(比如Lambda云) 来估测一下所需的GPU内存(至少12GB用于图像生成,至少24GB用于处理Transformer) 。
  其实假如GPU仅偶尔使用(每隔几天用几小时) ,甚至都不用去买个实体的,用云GPU就可以了。
  对了~如果你真的不在乎这点(?) 钱,就要追求极致性能,那可以看看这张表,即GPU的原始性能排行。
  那如果实在钱不够,即使是Tim哥推荐的最便宜的GPU也买不起,还有办法吗?
  那可以考虑二手呀!
  先去买个便宜的GPU用于原型设计和测试,然后在云端进行全面的实验和测试。关键性能点有哪些?
  盘点完英伟达的一堆GPU后,再来叙一叙关乎深度学习速度的几大GPU性能关键点。
  (如果你想稍微深入了解一些,请接着往下看。)
  Tim哥指出,重点有四:GPU的内存、核心、Tensor Core和缓存 。
  而其中最重要的是Tensor Core 。
  Tensor Core是英伟达为其高端GPU开发的一项技术,本质上,就是加速矩阵乘法的处理单元 。其中Tensor即张量,是一种能表示所有类型数据的数据类型。
  Tim表示,在所有深度神经网络中,最昂贵的部分是矩阵乘法,而有了Tensor Core,运算速度会变得非常快,有助于大大减少成本。
  就拿一个入门级的32×32矩阵乘法来说,通过Tensor Core,将矩阵乘法的运算时间从504个周期,降低到235个周期,直接减半。
  而且即便是超大规模的矩阵运算,Tensor Core也能轻松处理。在规模堪比GPT-3的训练中,Tensor Core的TFLOPS利用率也就约为45-65%。
  而当两个GPU都有Tensor Cores时,要比较它们性能,最佳指标之一就是内存带宽 。
  例如,A100 GPU的内存带宽为1555GB/s,而V100为900GB/s。因此,A100和V100相比,运算速度大概是后者的1555/900=1.73倍。
  由此可见,内存带宽会影响到Tensor Core的性能发挥。于是研究人员开始寻找其他GPU属性,使内存数据传输到Tensor Core的速度更快。
  然后,他们发现,GPU的一级缓存、二级缓存、共享内存和使用的寄存器数量 也都是相关因素。
  对于缓存来说,数据块越小,计算速度越快;所以需要把大的矩阵乘法,划分成小的子矩阵乘法。研究者们把这些小的子矩阵乘法称为"内存碎片"*(memory tiles)。
  一部分"碎片"被加载到Tensor Core中,由寄存器直接寻址。
  根据英伟达Ampere架构的规则,举个例子~
  把每一个权重矩阵都切成4个"碎片",并假设其中两个为零——于是就得到了一堆稀疏权重矩阵。
  然后把这些稀疏权重矩阵与一些密集输入相乘,Tensor Core功能启动,将稀疏矩阵压缩为密集表示,其大小为下图所示的一半。
  在压缩之后,密集压缩的"碎片"被送入Tensor Core,计算的矩阵乘法是一般大小的两倍。这样,运算速度就成了通常的2倍。
  Tim哥表示,上述性能点,他在统计英伟达GPU性能时都考虑在内了。
  如果你把这些东西吃透了话,以后就能完全靠自己 配置出最合适的"炼丹炉"了。
  原文传送门:
  https://timdettmers.com/2023/01/30/which-gpu-for-deep-learning/
  — 完 —
  量子位 QbitAI · 头条号签约
  关注我们,第一时间获知前沿科技动态

人才招用留实战策略人才是企业发展的压舱石,是企业变革的发动机,企业的发展离不开人才。按人才需求划分,人才可分为六大类高层管理人才,中层管理人才,基层优秀人才,专业技能人才专业营销人才,综合管理人才,唐山打人事件,却暴露出网友不同的人性!张雨绮是不是道德绑架?唉我真的服了,有些女生真的很不大气,明明都是出来玩的,人家不过就要求加个微信不乐意就不给呗,还骂人,在这之前我都觉得是女生不对,所以才造成了后面男生恼羞成怒,咱就是说,我们女生真的中国女排3消息朱婷近况更新,蔡斌收好消息,郎平被传出山挂帅众所周知,最近中国女排即将打响第二战菲律宾的比赛,所以在最近这段时间,传出中国女排各种各样的消息。接下来,就和大家分享一下中国女排在近期发生的三个非常备受关注的消息。首先第一个消息该选择哪种工业铝型材进行加工厚度呢?该选择哪种工业铝型材进行加工厚度呢?工业铝型材的表面一般都是阳极氧化,无论氧化膜的厚度是多少,与表面没有区别。所以对于我们这些外行来说,很难找到门的内侧,从而确定采购到的工业铝材到国产GPU创业潮这是一个没有奇迹的行业,它不需要爆发和热闹,需要耐心。文马慧程曼祺编辑程曼祺2020年6到8月,一家成立刚刚半年的GPU公司壁仞科技密集披露了3轮大额融资,几乎网罗了市场上最知名的尾田宣布海贼王将停载一个月酝酿最终章终于还是来了,超人气经典漫画海贼王的最终章,6月7日今天,从不碰SNS的尾田荣一郎惯例发表大字报,宣布海贼王将于6月27日起停载一个月,预定7月25日重新再开,明确海贼王将会突入最2022高考作文汇总2022高考作文已新鲜出炉,你押中了吗?2022全国新高考卷本手妙手俗手是围棋的三个术语。本手是指合乎棋理的正规下法妙手是指出人意料的精妙下法俗手是指貌似合理,而从全局看通常会受损养老金下月补发,企退人员会多发1个月的养老金吗?是咋回事呢?(点击上方蓝色按钮可同步收听解放双眼)养老金即将补发到位,企业退休人员会补发1个月的养老金,这是真的吗?是怎么一回事?为什么有的企退职工可以在6月份多补发一笔钱呢?我们一起来看看6唐山热度只增不减,九名人渣带动连锁反应,背后藏有更大疑团?从唐山打人事件曝出至今,仍在不断发酵。在网友们纷纷喊话要严惩凶手的同时,多名遭遇黑恶势力荼害的受害者也都纷纷搭乘顺风车,来维护自己的权益。受害者们究竟遭受了何等荼毒?这些黑恶势力又6月发放养老金,注意5个变化,有人领2个月的钱3类人没钱领6月要到了要发放养老金的时候,事关领钱方面,5个变化又要出现了,关系企退人员城乡居民的钱袋子,有人一个月能领2个月的养老金,究竟是怎么回事呢?我们一起来看看第一,企退职工和城乡居民10条顶级路线1条环中国线!115天的狂野人生,35000KM的伟大行程世界上本没有中国,是中国人创造了中国!中国本没有路,是中国人创造了中国公路!新中国成立时,中国公路里程仅8万公里!1959年,中国公路里程突破50万公里!1994年,中国公路里程突
一味中药搭配煮水,堪称散结王者!消一身结节包块增生!大家好,我是李医生为什么很多人就是爱长结节的体质呢?还有包块增生肌瘤这些,在中医的角度认为呢,这些都是癥瘕zhengjia的范畴。调理上呢,一定要抓住这个病的核心,才能一举消散这些切磋技艺增进友谊怀化市乒协十一届乒乓球精英赛在沅陵举行华声在线3月27日讯(通讯员瞿云李捷)3月26日,为期3天的怀化市乒协十一届乒乓球精英赛在沅陵降下帷幕。溆浦县乒协鹤城区乒协沅陵县乒协会同县乒协代表队分别夺得混合团体甲组前4名,鹤6686英超,水晶宫迎战莱斯特城实力分析0比1莱斯特城胜6686英超,水晶宫迎战莱斯特城实力分析0比1莱斯特城胜水晶宫和莱斯特城是英超联赛中的两支实力不俗的球队,他们在本场比赛中将进行一番激烈的角逐。首先来看水晶宫。这支球队在过去几个赛你认为中国男足的底线在哪?输赢都无所谓,因为他们都不差钱。底裤都没了要什么底线谢谢邀请回答!我个人认为中国球员的体质和技巧灵活性没有达到足球所需要的基本要求!中国足球缺的不是人才,也不是钱,是制度,是管理,为什么朱婷的关键球很可怕?朱婷现在已经成为世界第一主攻,这个称号可是靠实实在在的实力打出来的,已经得到全世界的公认。朱婷作为世界第一主攻,她的实力非常全面,是中国女排的定海神针,是中国女排获胜的最大保障。朱国足为什么一直很菜呢?国足,这么多年,越来越差的原因,我分析如下1。选拔球员,猜测并非按水平公正选拔的,很多都是关系户吧?2。球员的管理问题,纪律问题3。心态问题,感觉扭曲了,一切向钱看,导致没有国家荣家里装中央空调,现在对于三菱电机和大金纠结,到底是选哪个?去年装修了两套房,三菱电机和大金都看了,我家最后选的三菱电机,给岳母那选的大金。其实两个品牌都不错,具体选择还要根据家里的使用情况。以我家为例,普通的三居室,因为开发商室外机空间设糖尿病不花钱降血糖,这个方法每天30分钟,血糖越来越好事实证明,运动是最省事最有效,而且是事半功倍的降血糖救去,科学合理的运动,不但可以降低血糖血脂,有利于糖尿病的控制还能有效预防或延缓糖尿病的各种并发症。每天30分钟走路是一种简单而一个方子,上补心肺,中补脾胃,下补肝肾,建议收藏今天给大家分享一个古方,现在也有的中成药,就是三精丸,出自于道家,后又被医学入门录入,方子非常简单,只有三味药,三这个数字意思又泛指多数,也就是道家说的三生万物,久服延年身轻,面如慎吃!嗓子疼吃喉糖,小心这些副作用!身边很多人在感染甲流以后都会嗓子疼。而且现在正是春夏交接,很多人在日常生活中也会有嗓子疼的情况。有了这种情况很多人会选择吃喉糖,喉糖到底管不管用呢?要如何做才能缓解嗓子吞刀片的症状喝醋可以软化血管?专家错!当心腐蚀消化道!这4个软化血管的传言到底有没有真的?特邀心血管内科的医生守护你的健康你在生活中听过或使用过哪些偏方或小妙招这些都是靠谱的吗?关于软化血管的4大谣言你都做过吗?01hr喝醋可以软化血管?02hr喝红酒可以软化血管?03