范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

会写代码的AI开源了C语言写得比Codex还要好,掌握12种编程语言

  比 Codex 还会写 C 语言的 AI 代码生成模型,现在开源了!
  这段时间,用 AI 写代码可以说是大火,其中最著名的要属 OpenAI 的 Codex 和 DeepMind 的 AlphaCode。
  △基于 Codex 的 Copilot
  然而,这两个 AI 模型,全都没有开源:其中 AlphaCode 只给出了一些测试样例,而 Codex 只开放了 API。
  为此,来自 CMU 的几个研究人员,用 GPT-2 搞出了一个名叫 PolyCoder 的 AI 代码生成模型,而且还是开源的。
  据研究人员表示,虽然 PolyCoder 最大只有 27 亿参数(相比 Codex 有 120 亿参数),但它用 C 语言写出来的代码,比 Codex 的效果还要好。
  这里面究竟有什么秘诀?用 12 种编程语言代码集训练
  首先来看训练用的数据集,这也是 PolyCoder 的最大特点之一。此前,包括 Codex、CodeParrot 等 AI 代码生成模型,主要都是基于 Python 语言的代码来训练。
  例如 Codex 的评估数据集之一 HumanEval,评估的也是生成 Python 代码的效果。
  相比之下,PolyCoder 采用了多种编程语言代码集来训练,一共有 12 种:C、C#、C++、Go、Java、JavaScript、PHP、Python、Ruby、Rust、Scala 和 TypeScript。
  其中,C 语言的代码量是最多的,达到了 221GB;而 Python 代码的数据量比 Codex 和 CodeParrot 用得都要少。
  这里 PolyCoder 用的是 GitHub 上的公开代码,主要选取的是各种编程语言中比较受欢迎的库,每个库至少有 50 Stars。
  据研究人员表示,每种编程语言库的 Stars 总数加起来不超过 25k,以避免模型生成的代码效果太过于倾斜最流行的编程语言(通常编程语言越流行,库的 Stars 就越多)。
  通过提取库中的文件、经过简单处理(包括消除重复代码)后,一共筛选出大约 254GB 的数据用于训练。
  然后是预训练的方法。
  语言模型的预训练方法通常有三种。第一种是自左向右的语言模型,根据上文预测下文,比较适用于代码生成等;第二种是掩蔽语言模型,基于上下文预测屏蔽片段,比较适合代码分类等;第三种是编解码器模型,比较适用于代码注释等任务。
  这里 PolyCoder 主要采用的是第一种预训练方法。
  相比于同样采用 GPT-2 训练的 CodeParrot 和 Codex,PolyCoder 在超参数设置上也稍微有一些差异:
  PolyCoder 一共提供了三种不同的模型,分别有 27 亿参数、4 亿参数和 1.6 亿参数,研究人员可以根据自身需求和不同的训练能力来选取合适的模型。
  那么,最终训练出来的 AI 模型,代码生成效果如何?C 语言写得尤其好,但 Python 不行
  研究人员将 PolyCoder 与已有的 AI 代码生成模型进行了对比。由于 AlphaCode 不好比较(接口没开放),所以研究人员主要分析了下面这些模型,包括 GPT-Neo、CodeParrot 和 Codex 等。
  其中蓝色的是开源的,橙色的是没开源的:
  从参数量来看,PolyCoder 并不是最顶尖的,最大的 27 亿参数模型也只有 Codex 的四分之一不到。
  研究人员先是用语言模型评估常用的困惑度对一系列模型进行了比较。
  困惑度(Perplexity),用于衡量语言模型(LM)的好坏。困惑度越低,语言模型面对代码感到困惑的程度就越低,模型生成效果越好。
  从图中来看,PolyCoder 在 C 语言中意外取得了最好的效果(困惑度最低)。
  用大量 C 语言训练 PolyCoder 的结果说明,即使模型整体原理不变(基于 GPT-2),单纯改变训练用的代码集,也能训练出擅长不同语言风格的 AI 代码生成模型。
  可惜的是,从其他语言来看,生成的效果就完全没办法和 Codex 相比了:
  例如,在主要用于评估 Python 代码的 HumanEval 上,PolyCoder 的能力远不如 Codex 好:
  据论文分析,这可能是 Python 代码数据量、模型参数量不足等原因导致的。
  此外,作者们也提到,做出 PolyCoder 的目的主要还是为了开源一个 AI 代码生成模型,让更多人参与研究和使用。
  目前代码已经开源,无论是直接拿来用,还是试着在它的基础上开发新模型都可以。
  感兴趣的小伙伴可以上手一试了~作者介绍
  一作许方正(Frank Xu),目前在 CMU 读博,研究方向是 NLP、信息抽取等,发表过多篇顶会论文,包括 ICLR、ACL 和 EMNLP 等。本硕毕业于上海交通大学,师从朱其立教授。
  Uri Alon,在 CMU 进行博士后工作,研究方向是编程语言处理(PLP)、NLP 和深度学习。
  Graham Neubig,CMU 助理教授,研究方向是 NLP、机器翻译和基于机器学习的自然语言理解。
  Vincent J. Hellendoorn,CMU 计算机助理教授,主要研究方向是软件工程和机器学习,致力于利用智能方法帮助软件开发人员减少代码调试、程序优化等繁琐工作的时间。
  不知道作者们是否已经在用这个 AI 撸代码了(手动狗头)
  项目地址:
  https://github.com/VHellendoorn/Code-LMs
  论文地址:
  https://arxiv.org/abs/2202.13169

少而精为应对半导体短缺,智能手机OEM厂商正在减少摄像头数量IT之家12月9日消息,研究机构Omdia新研究发现,智能手机OEM厂商正在转向更高的相机分辨率和更少的摄像头配置,以应对持续的半导体短缺。2021年第三季度,三摄手机出货量增加到5530亿美元,SIA今年全球半导体销售额将再创历史新高感谢IT之家网友请你积口德的线索投递!IT之家12月9日消息,根据美国半导体行业协会(SIA)的最新数据,今年10月份全球半导体销售额同比增长24,达到488亿美元,环比增长1。1扩大车用半导体布局,曝鸿海正考虑扩充马来西亚8英寸晶圆厂产能鸿海投资的马来西亚8英寸晶圆厂SilTerra传来新进展,大股东DNeX集团据称正与鸿海以及合作伙伴中国北京盛世投资机构商讨是否扩充产能,该集团在Kulim的Kedah有多余的土地统信学院正式更名为统信软件教育与考试中心感谢IT之家网友菜鸟N号的线索投递!IT之家11月11日消息,统信软件今天发布了关于统信学院正式更名为统信软件教育与考试中心的通知。根据教育部等八部门关于规范大学学院名称登记使用的杨元庆联想三年要招12000人,说到做到IT之家2月24日消息,在大厂纷纷裁员的情况下,据新浪科技报道,联想集团董事长杨元庆昨日在接受采访时表示,联想依旧会启动大规模招聘,三年将达到12000人。人员的招聘肯定会坚持下去联想CEO杨元庆第三季度营收201。3亿美元,刷新历史纪录IT之家2月23日消息,今日联想集团发布最新财报。财报显示,202122财年第三财季营收201。3亿美元,同比增长16。7,预估187。8亿美元净利润6。40亿美元,同比增长62,联想集团202122财年第三财季净利润6。40亿美元,同比大涨622月23日午间消息,联想集团发布最新财报。财报显示,202122财年第三财季营收201。3亿美元,同比增长16。7,预估187。8亿美元净利润6。40亿美元,同比增长62,预估5。三星宣布3nm芯片成功流片采用GAA架构,性能优于台积电6月29日晚间消息,据外媒报道,三星宣布,3nm制程技术已经正式流片。据介绍,三星的3nm制程采用的是GAA架构,性能优于台积电的3nmFinFET架构。报道称,三星在3nm制程的TrendForce内存降价,2021年Q4整体DRAM产值萎缩咨询机构集邦咨询(TrendForce)日前表示,2021年第四季度,全球DRAM总产值为250。3亿美元,环比下降5。8,多数DRAM制造商当季出货量下滑。根据TrendForc三星在与美国存储器公司Netlist的专利诉讼中败诉美国加州存储器开发公司Netlist日前表示,美国加州中央地区法院做出了有利于该公司的判决,裁决三星在共同开发和许可协议中严重违反了义务。据THEELEC报道,Netlist指出,受疫情影响,力成西安厂产能利用率仅为40至50受疫情影响,中国台湾封测厂力成表示,西安厂产能利用率为40至50,对明年1月运营会产生少许影响。据台媒经济日报报道,力成指出,若员工所处的小区,有人员确诊,该小区便会封闭,因此公司
Marvell宣布将以6。5亿美元收购Avera半导体IT之家5月21日消息Marvell周一宣布,已与GlobalFoundries达成协议,将收购Avera半导体。此次收购将为Marvell带来额外的芯片设计能力,并将使其能够开发特斯拉贵阳梵华里超级充电站今日上线车主每天免停车费3小时IT之家3月19日消息,特斯拉方面今日宣布,贵阳梵华里超级充电站正式上线,上一个是武汉的信汇超级充电站。每日10002100,特斯拉车主可享3小时免停车费福利。IT之家曾报道,特斯蔚小理等投资手机电池厂欣旺达12亿元车用电池你赶紧造,我们需要宁德可替代眼下,谁手里握着车企的命脉?电池。福特电马月销不足400蔚来月交付大幅下跌,据说都是电池所累。所以即使中国有全球最大的动力电池供应商和最完备的产业链,仍然不能让车企放心。于是,蔚小特斯拉2022年2月中国大陆新增3座超级充电站18个超级充电桩IT之家3月19日消息,特斯拉中国充电团队最新数据显示,2022年2月新增3座超级充电站18个超级充电桩,已于全国3个城市县上线。IT之家了解到,特斯拉表示,截至目前,特斯拉在中国波音公司将与东方航空开展合作并提供支持,技术专家已做好准备IT之家3月22日消息,2022年3月21日,东航一架波音737客机在执行昆明广州航班任务时坠毁。机上人员共132人,其中旅客123人机组9人。随后,中国东方航空已启动应急机制,成快手如发现有人借东航坠机事件蹭热度,将视严重程度禁言封号IT之家3月21日消息,据快手官方发布,今日,东航一架搭载132人的波音737客机发生事故,目前该事故正在调查中,平台提醒广大用户,发布内容要坚持真实客观原则,不借助热点事件蹭热度(更新已基本确定主要撞击点,发现遇难者遗物21件)搭载132人的东航客机在广西坠毁感谢IT之家网友嘟嘟dd初恋的糖蓝海岸Nibiru假酒索隆气迷三道FAN8ktn雾太大看不清之家贫困户小夜灯Nanjo的线索投递!更新(03241706)据新华社消息,在24日的3已找到的黑匣子初判为舱音记录器,已连夜送往北京进行译码IT之家3月24日消息,据上游新闻报道,据321东航飞行事故国家应急处置指挥部第三场新闻发布会消息,经过现场搜救武警官兵和事故调查人员的共同努力,23日16时30分左右,在事故现场为遇难者哀悼,在美飞行员用轨迹写下MU5735RIP3月24日1056更新据微博用户KitpangCheung透露,该飞行员为一名在美国留学及工作的广东人,微博认证信息为美国联邦航空局FAA认证飞行员飞行教员。这位飞行员表示,飞行的中国铁路官方揭秘动车上也有黑匣子IT之家2月12日消息,据中国铁路发布,春运期间每天运行时间达到10余个小时的动车,是如何保持健康状态的?在中国铁路南宁局集团有限公司南宁动车所有一群研究动车黑匣子的年轻人,他们的510倍年薪,中国显示器制造商正高薪吸引LG三星等韩国OLED工程师中国显示器制造商正试图在OLED面板行业雇佣更多韩国工程师,以赶上韩国OLED面板公司。据businesskorea报道,中国显示器制造商的招聘对象大多是LGDisplay和三星D