范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

上线仅两天,AI大模型写论文网站光速下架不负责任的胡编乱造

  机器之心报道
  编辑:陈萍、小舟
  Galactica:「假装自己是个科学家。」
  几天前,Meta AI 联合 Papers with Code 发布了大型语言模型 Galactica,该模型的一大特点就是解放你的双手,代笔帮你写论文,写的论文有多完整呢?摘要、介绍、公式、参考文献等统统都有。
  就像下面这样,Galactica 生成的文本看起来就是一篇论文的配置:
  不止生成论文,Galactica 也可以生成词条的百科查询、对所提问题作出知识性的回答,除了文本生成外,Galactica 还可以执行涉及化学公式和蛋白质序列的多模态任务。例如在化学反应中,要求 Galactica 在化学方程 LaTeX 中预测反应的产物,模型仅根据反应物就能进行推理,结果如下:
  为了方便用户体验这项研究,该团队还专门上线了试用版。如下图,几天前该界面还显示输入、生成等功能。
  (之前版本)Galactica 试用版地址:https://galactica.org/
  短短几天,它的界面变成这样,已经不能进行输入。
  根据 Papers with Code 说法,他们从社区收到一些反馈,已经暂停 Galactica 的 Demo 演示功能。前两天还在推特发文称赞的图灵奖得主 Yann LeCun ,今天就很无奈的说了一句,再也不能从中获得快乐了,开心吗?
  不过与极力推崇该研究的人相比,有网友提出一些反对意见,与其带来的好处相比,Galactica 会带来更多负面后果,想想这对学生写论文会有什么影响。
  与学生用它来写论文相比,下面这位网友发现的问题就更严重了。
  「我问了 Galactica 一些问题,它的回答都是错误或有偏见的,但听起来是正确和权威的。」在一系列实验后,推特用户 Michael Black 表示:「Galactica 生成的文本合乎语法,让人感觉真实。其所生成的文章会变成真正的科学论文。这篇文章可能是正确的,但也可能是错误的或有偏见的,很难被发现,从而影响人们的思维方式。」
  「它提供了听起来是权威的科学,但没有科学方法的基础。Galactica 根据科学写作的统计特性产生伪科学,很难区分真假。这可能会开启一个深度科学造假的时代。这些被生成的论文将被其他人在真实的论文中引用。这将会是一团乱麻。我赞赏这个项目的初衷,但提醒大家还是要注意,这不是科学的加速器,甚至也不是科学写作的有用工具。这对科学来说是潜在的扭曲和危险。」
  Michael Black 回答部分截图。链接:https://twitter.com/Michael_J_Black/status/1593133722316189696
  发现 Galactica 存在不严谨、生成伪科学文章等问题的不止 Michael Black,其他网友也发现了该缺陷。下面我们来看看网友的其他评论。
  引起争议
  Galactica 试用版上线后,很多学者却对此提出了疑义。
  一位名叫 David Chapman 的 AI 学者指出语言模型应该是整理合成语言的,而不是生成知识:
  这确实是一个非常值得思考的问题,如果 AI 模型能生成「知识」,那么如何判断这些知识的正确与否呢?它们又会如何影响甚至误导人类呢?
  David Chapman 用自己的一篇论文为例说明了这个问题的严重性。Galactica 模型提取了论文中「A logical farce」部分的关键术语,然后使用一些相关的维基百科文章,最后编辑合成出一篇错漏百出的文章。
  由于 Galactica 模型的试用版已下架,我们无法查看这篇文章与论文原意的差距有多大。但可以想象,初学者如果阅读了 Galactica 模型合成的这篇文章,可能会被严重误导。
  知名 AI 学者、Robust.AI 创始人 Gary Marcus 也对 Galactica 模型表达了强烈的质疑:「大型语言模型(LLM)混淆数学和科学知识有点可怕。高中生可能会喜欢它,并用它来愚弄他们的老师。这应该令我们感到担忧。」
  来自纽约大学计算机科学系的学者们也测试了 Galactica 模型的生成结果,发现 Galactica 答非所问:
  图源:https://cs.nyu.edu/~davise/papers/ExperimentWithGalactica.html
  首先,在这个实验中,Galactica 模型的回答的确包含一些正确的信息,例如: 引力探测器 B(GP-B)确实是 NASA 发射的科学探测卫星,用于检验广义相对论的正确性和参考系拖拽效应。Leonard Schiff 确实是提出该实验的物理学家,Francis Everitt 是该项目的负责人(PI)。 引力探测器 A 确实是对爱因斯坦理论的早期检验。
  然而,纽约大学学者提出的问题是:与确定引力常数的实验相关的维基百科文章,而 Galactica 模型回答的是「与检验广义相对论有关的实验的百科信息」。这从根本上就出现了错误。
  不仅如此,Galactica 模型的回答中还有一些细节出现了事实性错误: Galactica 回答中强调不要混淆 GP-B 与引力探测器(Gravity Probe B)的实验,但实际上「GP-B」就是指「引力探测器 - B」的实验。 回答中提到的 Leonard Schiff 于 1937 年在麻省理工学院获得博士学位。他曾多次在宾夕法尼亚大学和斯坦福大学任教,但从未在马里兰大学任教。而 Francis Everitt 是在 1959 年于帝国理工学院获得博士学位的。 引力探测器 A(Gravity Probe A 在 1966 年并没有因为预算削减而被取消,也与陀螺仪(gyroscope)没有任何关系。实际上,引力探测器 A 于 1976 年发射,实验涉及微波激射器(maser)。
  纽约大学的这项实验非常具体明确地说明了 Galactica 模型的生成结果存在严重的错误,并且该研究进行了多个不同问题的实验,每一次 Galactica 的回答都是错漏百出的。这说明 Galactica 生成错误信息的情况绝非偶然。
  纽约大学实验报告:https://cs.nyu.edu/~davise/papers/ExperimentWithGalactica.html
  面对 Galactica 的失败,有网友将其归因于深度学习的局限性:「深度学习的本质是从数据中学习,这本来就不同于人类的智能,根本无法实现通用人工智能(AGI)」。
  关于深度学习未来的发展众说纷纭。但毫无疑问的是,Galactica 这种错误地生成「知识」的语言模型是不可取的。
  对此,你有什么看法,欢迎在评论区留言。
  参考链接:
  https://twitter.com/GaryMarcus/status/1593264844412977158?s=20&t=Gw8PrA_Ytku9_9TaubsHyw
  https://twitter.com/paperswithcode/status/1593259033787600896
  https://garymarcus.substack.com/p/a-few-words-about-bullshit?utm_source=twitter&sd=pf
  https://cs.nyu.edu/~davise/papers/ExperimentWithGalactica.html
  https://twitter.com/Meaningness/status/1592750932869013504?cxt=HHwWgICjlZyiy5osAAAA

张锡纯医按生姜生姜皮干姜炮姜,到底应该如何选择使用?我们之前讲过很多张锡纯关于使用干姜的医案,在医生开的处方中,其实还有两味药非常的常见,一个是我们厨房里几乎每天都会用到的食材生姜,另一个就是经过特殊炮制的叫炮姜,那么这几个到底有什老话说吃饭大汗,一生白干是什么意思?爱出汗的人好还是不好在剧烈运动的条件下,身体常常会出现排汗的现象,这是身体循环的正常生理表现。人属于恒温动物,当环境中温度低于气温或高于体温时,为了维持自身的正常温度身体会做出相对的反应。排汗反应,是和而泰与国际知名汽车零部件公司博格华纳签订供应合同,总金额2。46亿欧元和而泰(002402)于3月14日发布公告称,深圳和而泰智能控制股份有限公司于近日与国际知名汽车零部件公司博格华纳签订InpidualSupplyContract。根据签署的供应合罗泽谈哈兰德受到批评我对此感到惊讶,若你们不要他就送给我直播吧3月14日讯莱比锡主帅罗泽在对阵曼城次回合的赛前发布会中表示,他对哈兰德受到批评感到惊讶,每个人都知道这位挪威射手的实力。罗泽曾在多特执教哈兰德,他说道如果你们不想要他,就把注意!温州市区这些路段本周末实施交通管制!2023年温州马拉松比赛将于3月19日举行,届时,市公安局交管局将对马拉松比赛沿线道路采取交通管制。本次比赛共有18000名运动员分别参加全程马拉松半程马拉松欢乐跑等三项比赛。其中忻州古城期待值拉满!多家知名品牌即将登陆!忻州古城始建于东汉建安二十年(公元215年),距今已有近1800年的历史,是晋北政治文化中心和商品集散重镇。自开城以来,已有500家优质店铺入驻。街区内落成院子600多套,旅游餐饮墨西哥护照免签国家及地区多达149个墨西哥是一个自由市场经济体,拥有现代化的工业与农业,私有经济比重也在大幅提升。1994年北美自由贸易区正式建立后,墨西哥与美国的贸易和投资往来增长很快,极大地促进了经济发展和国民收知名主持人田园回应争议呼吁停止网暴,我一辈子受人尊重很心寒3月15日,备受争议的女网红打人事件迎来最新进展,因为主持正义,为白衣小伙和眼镜女孩从中调解而被网暴的知名主持人田园发声,回应了事情的来龙去脉,并且呼吁大家停止网暴,我60多岁人生NASA与DOE在月球远端的望远镜将揭开宇宙的黑暗时代美国宇航局和能源部(DOE)正在合作开发一种科学仪器,该仪器将在月球远端的夜间月球表面的恶劣的环境中生存,以尝试对宇宙的黑暗时代进行首次测量。该仪器被命名为月球表面电磁学实验夜间(太空电梯到月球基地,太空旅游有多酷?科技之巅你是否有过这样的幻想乘坐一部电梯,从地球表面直达太空,欣赏星空的美景,体验失重的快感,甚至登上月球或火星?这听起来像是科幻小说或电影中的情节,但实际上,这样的设备已经被人类中国最偏僻的国际机场,距离市区70公里,坐地铁至少需要1小时便捷的交通是一个城市发展的决定性因素,所以通常重要的交通枢纽,都会设立在人口密集的繁华地段,尤其是机场,在满足巨大客流量的同时,还要方便乘客出行,所以机场的选址一般不会距离市中心太
科学家精神闪耀青春元宇宙制图张玉佳程璨中国科学院院士童庆禧为广大青少年讲遥感技术,解密观测地球的天眼。博恩思机器人外科手术室解决方案科大讯飞人工智能未来科技场景图中国青年报社联合中国石油天然气集团有限公司人民日报每日金句摘抄1山畔嬉江水江上揽五山2只有坚定不移集中精力办好自己的事情,才能乱云飞渡仍从容任尔东西南北风,在变局中赢得主动赢得优势赢得未来。3行百里者半九十。4着眼长远必立于当下。5功不唐捐,又打一辽宁虎!两天前还亮相,曾先后主政盘锦鞍山两市中央再打一虎。6月2日晚,中央纪委国家监委网站发布消息,辽宁省人大常委会副主任孙国相涉嫌严重违纪违法,目前正接受中央纪委国家监委纪律审查和监察调查。今年57岁的孙国相曾先后主政辽宁无力偿还杭州的房贷,失业妹子选择下海,我们从中可以学到什么?年轻的妹子为何选择了下海?今天,财经有料哥和大家谈一谈在公平优先的时代进程背景下,我们需要注意规避什么样的重大风险。经济财经职场财富房贷作者财经有料哥有料财经今天,财经有料哥继续和方便面巨头倒下从20亿巅峰到贱卖,只因为老板太自信我国的方便面有四大巨头,它们分别是康师傅统一今麦郎和白象。之前因为老坑酸菜的问题,让这四家方便面被推到了风口浪尖。前三个是因为涉及了老坛酸菜的问题,而白象则是因为坚持国产和雇佣残疾我,26年前离开体制,90年代身价百万,39岁到处玩过上退休生活这是我们讲述的第423位真人的故事我是杜哥清迈杜哥,1964年出生的老北京人。由于天性自由散漫。32岁,我辞去正科级职位下海经商。开餐馆办公司事业顺风顺水,90年代已经有百万身家。地下八英里突然开怼中国说唱巅峰对决这波贝贝又躺枪了自古以来Beef在说唱圈里就是不可或缺的存在,但没想到的是除了Rapper以外节目之间也能有Beef。昨晚在圈内里很有影响力的地下八英里突然发布了一条让很多人都非常诧异的言论。别成我怀了反派的崽我怀了反派的崽,怀的过程挺享受,怀了之后整个人都蒙了。我找到反派,说了这件事。反派却揽着我的腰,说不想要直说,没必要找这么蹩脚的借口。我被逼急了,教他搭脉。记住了,这是喜脉。一hr玉女掌门翁美玲在事业巅峰时,为何因一通电话结束自己生命飞雪连天射白鹿,笑书神侠倚碧鸳,在金庸先生的笔下,呈现出一个快意恩仇的武侠世界。在金庸的江湖中交织着爱恨情仇,不仅有着如云的武林高手,也有着数不清的美女。无论是周芷若还是小龙女,赵基辛格中国重回巅峰是理所当然的,没有国家能戒掉中国制造笔者杰鲁鲁一场新冠疫情,让我真切地感受到中国世界工厂的实力。你们知道吗?新冠疫情爆发以后,为什么我们国家一直坚持严格抗疫策略,而西方国家要开放社会,任由新冠病毒与人和谐相处,这其中亮剑!李云龙的人格魅力值得敬佩!屡次犯错,依旧讨人喜欢?亮剑的主旨就是人要有亮剑精神,要敢于亮剑!亮出你的剑!(全文2289字)一面对强者敢于亮剑李云龙是个打仗的人才,用兵的人才。用他的话总结兵熊熊一个将熊熊一窝。来啊!1。善于把握细节