范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

Meta大模型成了科学造假发动机,发布3天就在争议中下架

  梦晨 发自 凹非寺
  量子位 | 公众号 QbitAI
  Meta最新大模型差点成了"科研造假发动机",刚出3天就在争议中下架。
  1200亿参数语言模型Galactica,在4800万篇学术论文 和各式教科书、百科 等数据上训练而来。
  (与太空堡垒卡拉狄加同名)
  其本意是想解决学术界信息过载 ,帮助研究人员做信息梳理、知识推理和写作辅助,一度被认为是"科研者的福音" ,或者"写论文的Copilot" 。
  But,一经开放使用,很快就被网友们发现了大问题。
  它确实能为自己生成的内容引用文献,但有时这个文献并不存在,作者却是真实存在的人 。
  它能生成看起来像模像样的科普文字,但内容却是完全错误的 。
  △真空中的光速和声速接近可还行?
  著名的Gary·AI悲观主义者·Marcus也来吐槽,Galactica把他的出生日期、教育经历和研究领域等信息全搞错了。
  对以上种种问题,马克斯普朗克智能系统研究所所长Michael Black 总结道:这将开启一个 科学深度造假 (deep scientific fakes)的时代。
  会出现研究者从未写过的虚假论文,这些论文随后会被其他真实的论文引用,简直乱套了。
  虽然他也注意到,Galactica的开发者在每个输出内容后都加了"内容可能不可靠"的警告,但"潘多拉的魔盒一旦开启,就关不上了"。
  事实上他的担忧不无道理,AI生成内容的速度要比人类快的多,一旦大量被搜索引擎抓取就有可能出现在前排,甚至被当成正确答案展示在最上面,误导更多人。
  这样的争议持续了两三天,团队只好无奈宣布Demo暂时下架,论文和源代码继续开放给相关领域研究者。
  作为Meta首席科学家,LeCun对这个局面并不满意。
  与他观点一致的网友认为,Galactica是有帮助且有趣的,只是被个别人滥用了。
  本意是好的
  Galactica由Meta AI与Papers with Code合作开发。
  在论文引言部分,团队写到:2022年5月,arXiv上每天平均新增516篇论文……科学数据的增长速度更是比人们的处理能力快……一个人已经不可能读完特定研究领域的论文。
  搜索引擎不直接组织信息,维基百科这样的形式需要人力来维护,研究人员持续为信息过载感到不知所措。
  因此他们提出,语言大模型可以更好的存储、组合和推理科学知识,并提出一个终极愿景:
  神经网络将成为科学研究的下一代人机界面,就从这篇论文开始。
  本意是好的,而且Galactica的表现也确实不错。
  除了文本、数学公式、代码任务之外,它还可以执行化学式、蛋白质序列等多模态任务。
  Galactica 1200亿参数版本在许多科学类任务上性能超越OpenAI的GPT-3、DeepMin的Chinchilla与Gopher、以及开源的BLOOM。
  然鹅,测试基准毕竟是死的,一旦进入生产环境开放给用户,还是会出现开发时预料不到的情况。
  问题出在哪?
  在Hacker News上有人认为,语言模型终究是在"对语言建模"而不是对内容。
  就像AI绘画模型一样,你让它画"骑马的宇航员"它就能画出来,虽然这不太可能发生,但是很有趣。
  类似的讨论也发生在Twitter上。如果你让AI生成一篇关于"生活在太空的熊"的维基页面,AI也会试着生成。
  有人认为,不,AI需要判断出这个要求不合理。
  关键就在于,人们对图片和文字的要求是不一样的。
  图片中的内容不合理,人们只会觉得有趣而接受。而文字的内容错了,那就不可接受。
  LeCun则认为这种工具的用法应该是辅助驾驶,它不会帮你写好论文,只是帮你在过程中减轻认知负担。
  以谷歌为代表的AI大厂,近年来对大模型特别是生成式模型的发布非常谨慎,像是对话模型LaMDA和AI绘画Imagen等都不开源、不给Demo或只给限定场景下的Demo。
  另一方面,以Stable Diffusion为代表开源项目推动了整个领域的技术进步与应用普及,但也在版权和生成有害内容方面引发一些问题。
  你更支持哪种做法?或者还有第三条路么?
  Galactica:
  https://galactica.org/
  参考链接:
  [1]https://news.ycombinator.com/item?id=33611265
  [2]https://twitter.com/Michael_J_Black/status/1593133746282106887
  [3]https://twitter.com/paperswithcode/status/1592546933679476736
  — 完 —
  量子位 QbitAI · 头条号签约
  关注我们,第一时间获知前沿科技动态

南京同曦还没比赛就已经输了一场,这是发生了什么?CBA官方今天发布一条消息,南京同曦由于球员核酸检测结果有一些问题,全队需要被集体隔离,这样以来南京同曦无法参加和吉林男篮的比赛,按照比赛规定,南京同曦这一场比赛被判负。也就是说南NBA2022级新秀排行榜赛程贡献排名及最佳新秀赔率本次赛程的新秀排名,是基于赛季目前为止的表现,对所在球队最有贡献的价值排行。在生涯这个阶段,球员所处的球队环境是极其重要的,一些球队会更愿意把新秀直接扔进火堆,赋予他们比其他新秀更有线电视你不懂用户近年来,由于市场竞争的压力,各地有线电视狼烟四起,主要的危机还是来自不断流失的用户,而不断流失用户造成市场份额的萎缩继而导致收入和利润的急剧减少。有线电视似乎已经在走下坡路,这种下精益者笃行,变局者赋新格力以多元化续写好电器新篇章随着中国制造转型升级,格力的发展理念也从好空调格力造向好电器格力造转变。然而变革总伴随着阵痛,在这简单变化的两个字背后,透视出格力十年历程中筚路蓝缕的开拓创新放眼世界的鸿鹄之志。好小胖被和谐竟然是手机纠纷矛盾激化关于小胖和阿云冲突,据俩人共同的好友称阿云之前给小胖9800元,让小胖从国内给他买一个iPhone12手机,小胖一直没有给他手机,还有个原因是阿云说他在直播的时候小胖找人用凉水泼他电脑怎么共享文件夹两台电脑之间的文件传输,可以用U盘,也可以用第三方的传输工具进行传输,但是这些都太过麻烦了,最简单的方法是在局域网内直接进行文件的传输,这样不仅速度快,还方便。关于怎么设置共享文件SAPS4HANA2022安装记录2。安装配置SUSESAPS4HANA是安装并运行在SUSELinuxEnterprise系统上的,所以需要先安装好SUSE系统。如何安装VMwareworkstation及输入序列号就不做描述了,自创新加成模块化设计的鑫谷昆仑御风中塔机箱如果说机箱的主要卖点是什么,那么我感觉仍旧是内部空间大小散热设计可扩展性和颜值。伴随着诸多自带冷排设计的高性能显卡出现,比如自带360水冷的七彩虹RTX4090Neptune水神技得到阅读器F7首发体验静下心,帮助我专注每一秒的阅读不知道你有没有用过罗振宇的得到APP,实际上,我平时也很喜欢在得到APP上增进学识,因为里面的知识内容还是很丰富的。而最近我收到了一款得到的阅读器得到阅读器F7,这也是得到第一款拥格力地产重启收购珠海免税集团!曾因原董事长被立案而暂停近日,格力地产(600185)公告宣布,拟继续推动重大资产重组事项,以发行股份及支付现金方式购买珠海市免税企业集团有限公司(以下简称珠海免税)100股权。据悉,一年多以前,格力地产我在南京音乐台喂鸽子,鸽子起飞时真的可以治愈一切或许是天冷了,最近更新文章的频率也是格外的低,虽然期间也走了南京许多地方,拍摄类型有秋景老街小镇抑或曾经废弃的工厂旧址。整理图片时,发现今年拍的中山陵音乐台竟然还躺在相机内存卡中,
立秋后,火了一种上衣叫小香开衫,配裤子洋气配裙子优雅立秋的氛围感,是一种温柔优雅。与炎热夏季的热情不同,虽然仍然有高温的加持,但整体的穿衣节奏开始放缓。入手新品的方向,不再是争奇斗艳的暴露款和时尚款,转而倾向更加分寸得当的舒适感。所董卿国风造型很惊艳,穿深V领上衣开叉到腰,不风尘反而有高贵感职业的不同,让女性们的穿搭风格也有所不同。比如,从事时尚领域的女性,通常在穿搭风格上偏向大胆前卫,而职场白领们,穿搭风格通常比较严肃正式。因为职业的差别,要求女性呈现出来的精神面貌今夏上衣别乱穿了!2022流行这6件,显瘦又气质夏天,到处都是高温预警,除了好看时髦外,清凉解暑也成了夏日穿搭的重要部分。所以为了和夏日高温接轨,今夏的穿搭流量密码也从往年的裙装变成了吊带背心!放眼望去,满大街都是穿吊带背心的甜只为这双鞋偶遇只为这双鞋,眼前一双绿色镶钻的鞋子确实让我惊艳了。意想不到的是,它居然有三副鞋跟,可以随意切换。也许孤陋寡闻,这是我迄今为止才发现的。驻足流连欣赏,真的只为这双鞋,问老板,多少收款码风控加强,支付宝和微信今日起按新标准完善商户认证目前各家支付公司的收款码因为简单方便易用又便宜,很多商家和个人都在使用。今年2月份以来,由于各家的风控原因,多家支付产品对功能进行了整改。图片信息来自互联网某管家通知1由于风险整改今日A股继续出现大跌,是什么原因导致的?现在散户应该怎么办?今天是9月15日,中午A股市场收盘了,今天的A股再次出现大跌,让人垂头丧气,让人心灰意冷,是什么原因导致的?现在的散户应该怎么办?紧急提醒所有人,今天的内容比较关键,所以人务必认真02!国乒男单黑马大逆转,爆冷淘汰日本名将,头号种子出局2022年9月14日,乒乓球WTT哈萨克斯坦赛继续进行,男单赛场爆出冷门,国乒直板黑马严升02落后完成大逆转,连赢三局32淘汰日本名将宇田幸矢,接下来对阵沙特选手阿尔卡德拉维,争夺新车定了!9月27日正式上市,续航超600公里!飞凡R7最新消息文懂车帝原创付博懂车帝原创产品日前,我们从相关渠道获悉,飞凡R7将于9月27日正式上市并且于10月下旬开启交付。新车作为飞凡汽车的旗舰车型,外观设计十分个性,内饰采用了与奔驰EQS行业观察卤味市场即将迎来第四股竞争格局将会如何变?封面天天见吃喝有度据紫燕食品披露的公告,公司即将在A股上市,拟公开发行股票4200万股,募资7。99亿元,申购时间为9月15日。卤味市场即将迎来第四股,卤味市场面临更激烈的竞争。紫燕食品是从四川走出一次过4科!卫生资格考试,优鼎教育学员一次性通过率行业第一通过率超过99!优鼎教育2022年卫生技术资格考试通过率再创新高!背后的秘诀是什么?优鼎教育卫生技术考试学员高分榜2022优鼎教育学员的反馈分享一波上岸报喜,给大家沾沾喜气为什么优住建部持续完善住房保障体系证券时报记者张达昨日,中共中央宣传部举行中国这十年系列主题新闻发布会,住建部副部长姜万荣介绍新时代住房和城乡建设事业高质量发展举措和成效有关情况,并对市场关注的问题答记者问。回顾这