范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

特斯拉前AI总监疯狂点赞单张A100,10秒训练CIFAR10破世界纪录

  编辑:Aeneas 好困  【新智元导读】这位小哥在单张A100上,10秒完成了CIFAR-10训练,打破了世界纪录,还引来了Karpathy啧啧称赞。
  刷新世界纪录!
  用600行代码,在单张A100上,不到10秒,就完成了CIFAR-10数据集的训练,并且精度高达94%。
  特斯拉前AI总监Andrej Karpathy连发3条推特,疯狂点赞。
  Karpathy之所以如此激动,是因为12年前,他试过手动对CIFAR-10进行分类,得到的也是94%!而当时的SOTA只有80%。
  项目介绍
  项目地址:https://github.com/tysam-code/hlb-CIFAR10  git clone https://github.com/tysam-code/hlb-CIFAR10 && cd hlb-CIFAR10 && python -m pip install -r requirements.txt && python main.py
  这段代码可以在Colab上直接使用,事实上——其中大部分是在Colab中开发的。
  这位叫Tysam的小哥,给自己定下的目标是—— 简单 初学者友好 只需torch和python的常用代码 可破解 几乎不用外部依赖(目前只有torch和torchvision) 破世界纪录的单GPU训练时间(此前在A100上的世界纪录是18.1秒,而Tysam打破了世界纪录——小于10秒) 在2年内让训练时间小于2秒
  为了达成快速训练的神经网络实现,Tysam参考了David Page在CIFAR-10图像分类数据集上有效训练残差网络的代码,但几乎是从头编写的。
  这种做法的好处是,Tysam code现在保持着CIFAR-10上单GPU训练速度的世界纪录——在A100上不到10秒!
  在David Page代码的基础上,Tysam做了如下改动: 压缩和激励层(squeeze and excite layers) 非常多的超参数调整 复杂架构修剪(miscellaneous architecture trimmings) 更改内存格式,更好地使用张量核心等 其他
  与原始代码相比,Tysam的代码全部都在一个文件中,而且非常扁平flat。
  此外,所有的管线也都已经公开,有兴趣的朋友可以在里面快速探索自己的想法。
  至于为什么会选择ConvNet,而不是现在最流行的Transformer呢?
  在Tysam看来,虽然Transformer是新事物,但信息从训练集中压缩到神经网络中的方式,实际上始终都遵循着同样的一套基本数学原理。
  Tysam希望,在一两年内让这个代码库在2秒内完成训练,在四到五年内在1秒内完成训练。
  Karpathy疯狂点赞
  对于Tysam的代码,Karpathy赞叹不已,他丝毫不吝啬自己的溢美之辞——
  「我喜欢这种极简的设计美学,它让阅读代码不再是精疲力竭的寻宝过程。你不需要把代码散布在复杂的嵌套目录结构之中,然后用各种指令把事情搞得过于复杂。」
  随后,Karpathy还表示,这让他想起了自己在12年前做的测试:
  12年前,「肉眼」分类实现了94%的准确率,用时未知。
  12年后,600行代码实现了94%的准确率,用时不到10秒。
  当时的过程大概是:
  在一个平平无奇的周末,Karpathy突然想看看人类在这个数据集上能达到什么样的精度。
  于是就快速地手搓了一段MATLAB代码用于测试。
  界面长这个样子:
  在测试过程中,程序首先会一张一张图片地展示,然后Karpathy会按下0-9(10个键),对应这张图他所认为的类别(10个分类)。
  在经过了不知道多长时间之后,Karpathy终于完成了400张图片的分类,准确率为94%左右。
  那么,为什么不是100%呢?
  Karpathy:「因为有些图像真的太扯了!」
  比如下面这几个:
  也难怪Karpathy当年预测AI所能达到的极限是85-90%(笑)。
  当然,后来的结果大家也都知道了,CIFAR-10分类的准确率早就被刷到了99.5%。
  著名的CIFAR-10
  众所周知,CIFAR-10是由Geoffrey Hinton和他的学生Alex Krizhevsky和Ilya Sutskever整理的一个用于识别普适物体的小型数据集,也是如今机器学习研究中最广泛使用的数据集之一。
  CIFAR-10数据集由10类32x32的彩色图片组成,总共包含60000张图片,其中50000张图片作为训练集,10000张图片作为测试集。
  这10个类别为:飞机( airplane )、汽车( automobile )、鸟类( bird )、猫( cat )、鹿( deer )、狗( dog )、蛙类( frog )、马( horse )、船( ship )和卡车( truck )。
  参考资料:
  https://github.com/tysam-code/hlb-CIFAR10

庙号之中太祖含金量最高,高祖次之,太宗能排第四,第三是哪个?庙号是中国古代皇帝死后在庙中被供奉时所称呼的名号,起源于商朝。以唐朝为分界线,唐朝之前,除却割据政权不讲规则的滥用,庙号的使用还是很严格的。像西汉12帝,只有4帝有庙号,连汉景帝这美媒预测202223赛季最好的25名得分后卫,按实力排名谁被低估了202122赛季结束后,我们可以看到不少球队针对球队阵容进行了升级补强,特别是得分这一块。2022年休赛季,像老鹰和骑士都对自己得分后卫的球员进行了替补。可见现在得分后卫也依旧是NIFA2022中国头部家电企业展现高超实力2022年9月2日6日,2022年柏林消费电子产品及家用电器展览会(简称IFA2022)在德国柏林举行。一年一度的IFA展是世界上规模最大品类最齐全的电子消费展之一。IFA2022收购德邦后,京东物流实力彻底暴露收购德邦后,京东快运爆发式增长半年前,市场上爆出京东收购德邦的传言,业内普遍认为,此举将补足京东在快运领域的短板。半年后,收购案步入尾声,京东的快运实力,也出现爆发式增长趋势。近日买手机没必要盲目追新,这4款老旗舰凭实力捡漏,流畅再用3年买手机没必要盲目追新,这4款老旗舰凭实力捡漏,流畅再用3年第一款荣耀Magic3Pro内置4600mAh电池,支持66W有线快充以及50W无线快充。后置相机模组,5000万像素主摄油价调整消息今天9月2日,调整后全国92号95号汽油零售价格油价调整计价周期照常运行,马上就要到休息日了,根据数据显示,截至本计价周期的第7个工作日,原油综合变化率4。99,下一轮成品油调价窗口将于9月6日24时开启。现在油价调整幅度达到了男篮欧洲杯第6日戈贝尔两双率法国赢球小萨一扫低迷北京时间9月7日,2022年男篮欧洲杯进入第6个比赛日,在今天,总共进行了12场比赛。以下是详细内容1。立陶宛8764匈牙利在B组的一场对决中,立陶宛8764击败匈牙利。此役,立陶天能股份披露2022年半年报实现营收172。27亿元8月26日,A股上市公司天能股份(代码688819。SH)发布2022年半年度业绩报告。2022年1月1日2022年6月30日,公司实现营业收入172。27亿元,同比增长5。98,上半年网上立案31。38万件河北省法院网上诉讼服务全面加强我省法院网上诉讼服务全面加强今年上半年共网上立案31。38万件,网上开庭10。71万次,在线调解27。53万件从省法院获悉,今年上半年,全省法院加强民生司法保障,服务保障20项民心唐山打人案最新进展,河北省公安厅官员透露主犯陈继志部分信息唐山打人案最新进展,河北省公安厅官员透露主犯陈继志部分信息从唐山打人到现在,已过去65天了,被打女孩一直没有露面,就连被打的两个女孩和四个被打女孩的家庭也没有发出任何声音。就连那个蒋军师长被俘,徐向前答应放人,为何最终仍然枪决?作者东旭子敬,救我!什么条件我都能答应!1931年3月的一天,湖北省广水的双桥镇一家低矮黑暗的农舍,一位灰头土脸的蒋军师长向一位红军将领扑通一声跪下,声音颤抖地说。老军长,快起来,