范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

ChatGPT相当于9岁人类小孩,它还真把自己当个人了?

  要问最近网上最火的科技名词是什么,那一定是"ChatGPT" 和"人工智能" 。由OpenAI开发的智能聊天机器人ChatGPT,能够回答人们提出的各种问题,可以根据人提出的要求生成文章、翻译外语,还有写代码的本领。
  其实,ChatGPT并非第一个具备这些功能的人工智能,只不过,它的能力和之前的人工智能比起来,几乎是质的飞跃——能和人类有问有答不说,写出的文章居然也像模像样。许多人猜测,ChatGPT标志着人工智能领域的又一次重大突破 。
  一时间,许多研究者都开始关注ChatGPT,仔细研究它的各种能力。
  2月11日,斯坦福大学的计算机科学家米哈尔·科辛斯基(Michal Kosinski)提交了一篇名为《心智理论可能从大语言模型中自发涌现》(Theory of Mind May Have Spontaneously Emerged in Large Language Models)论文的预印本,又增加了ChatGPT的热度。
  所谓"大语言模型",指的就是以ChatGPT为代表的一类人工智能。研究者利用心理学测试,发现GPT-3.5这个版本的人工智能(目前流行的ChatGPT源自GPT-3版本。)已经产生了一定的"心智理论"(也经常翻译为心理理论)。几天的功夫,中文互联网上就出现了各种解读。有人说这个人工智能已经具备了九岁孩子的同理心;有人说这个人工智能已经有了心智;还有人说GPT-3.5的智力已经和九岁的孩子相当了……
  等一等,"心智理论" "同理心""心智""智力",这些词似曾相识,意思似乎又不大一样。GPT-3.5和九岁孩子比起来,到底谁更厉害? 为了回答这个问题,我们需要做一个词义辨析,再看看这篇论文究竟说了什么。
  01
  什么是心智理论?   很多人可能是第一次听说心智理论这个词。不要被字面意思误导,心智理论不是一种理论,而是一种能力。简单来说,就是理解和推断他人心理状态的能力。举个例子,你趁朋友不在,仔细藏起了一件礼物,等他回来发现了礼物时,他会是什么心情呢?一般人会本能的想到,应该会惊讶、惊喜。能想到这一层,是因为你知道,藏起礼物这件事儿对方不知道,而且,你认为对方收到礼物会觉得高兴。这就说明,你具备推测他人心理状态的能力。   看到这里,有人要问了,这不是正常人的正常思维吗,怎么还算一种能力呢?其实,心理学家最初研究这个问题,研究的目标对象还真不是人类。1978年,心理学家Premark和Woodruff发表了一篇著名论文,叫做《黑猩猩是否有心智理论?》。作者指出,人类只能观察同类的行为 ,不可能看到对方心里是怎么想的,但是却可以推断出对方的意图、知识、信念、思想、怀疑,甚至伪装 等等。这是人类的本能。那么,黑猩猩能做到这一点吗?如果可以,说明黑猩猩也和人一样,有推测他人内心的能力。心理学家发现,黑猩猩能意识到他人的想法,确实具备一定的心智理论。   图注:心理学家使用的测试,黑猩猩需要观察实验员的困境,尝试推断如何帮助他。   这篇论文一出现,立刻启发了许多学者。他们要问了,心智理论真的是人类的本能吗?人类又是如何获得心智理论的?于是,心理学家做了一系列的研究,结果发现,人类也不是一出生就具备心智理论的。婴幼儿先是能跟随其他人切换注意的目标,渐渐意识到其他人有自己的想法。再然后,幼儿开始理解和推测别人的心理状态,接下来,这种推断能力会越来越准确,直到达到和成年人一样,能不假思索地理解他人。   心理学家究竟是怎么测试的呢?我们可以看两个经典的实验。第一个叫做错误信念测试 。心理学家给小孩展示一组图片,一个小朋友面前放着一个口袋,上面有巧克力标签,但里边装的却是爆米花。这时,心理学家提问了:如果有个小朋友刚刚过来,看到这个袋子,会觉得里边装的是什么呢?成年人会认为,这个小朋友没见见到袋子里边的爆米花,会根据标签认为是巧克力。但心智理论尚未健全的孩子就不一样了,他们可能无法分清自己知道什么、其他人又知道什么,于是推断说这个小朋友认为里边是爆米花。随着孩子年龄增长,心理学家还会加大难度,让孩子来推断,画中的小朋友认为,另一个小朋友怎么想。这就需要孩子能更熟练推断不同人的心理状态。   另一个实验叫做萨丽-安妮测试 ,心理学家给孩子展示一段录像或者图片,描绘的是萨丽和安妮一起待在房间里。这时,萨丽把一个球放到了篮子里,然后就离开了房间。安妮等她走了以后,把球藏到了盒子里。过了一会儿,萨丽回来了,请问,她会去哪里找球呢?成年人能推断出来,萨丽不知道安妮藏球的事儿,还是会去篮子里找球。但是孩子就不一样了,他们的心智理论还不成熟时,他们可能认为,萨丽会去盒子里寻找。   这两类测试都发现,孩子要到四岁才能正确回答问题,通过测试,而且一开始成绩还很不稳定。要到九岁才能灵活推测任何其他人的心理状态。   图注:萨丽-安妮测试示意图 来自维基百科   其实,咱们每个人都经历过这种"猜不透"、"看不懂"别人的阶段,只不过,随着年纪增长,大部分人都会获得心智理论,加上儿时的记忆逐渐模糊。如果不是心理学家做实验,人们还真不知道孩子的心理是这样的。   02
  ChatGPT有没有心?   看了这两个实验,我们再来看这篇引起讨论的论文心里就有数了。大语言模型处理的是自然语言,于是科学家就把刚才的两个测试都编写成故事,输入给GPT-3.5,然后向它提出问题。结果,在错误信念实验中, GPT-3.5能正确回答20个问题中的17个;在萨丽-安妮测试中,GPT-3.5回答20个问题能够全对。为了防止GPT-3.5是靠关键词猜中的,科学家还改换不同的表达方式反复提问,甚至故意加入了一些逻辑混乱的"测谎题"。结果, GPT-3.5也通过了检测,依然能够回答正确的问题,遇到逻辑混乱的问题时也被绕晕了。   图注:基于GPT-3.5的ChatGPT在错误信念中输入的故事和测试成绩   可不要小看这个成绩,之前的人工智能都不能通过心智理论测试。 不仅如此,科学家同时检测了近来出现的其他8个人工智能,包括同类模型之前的版本。结果发现,只有GPT-3.5这个版本能达到这个成绩。GPT-3的版本成绩就大幅下降。有几个人工智能一道测试题也答不对。可以说,最新版本的GPT-3.5通过了这个心智理论的测试,而且大幅超越了它之前的版本。而且,它这个正确率逼近了人类九岁孩子的成绩,这才有了网上神乎其神的解读 。   图注:不同人工智能正确率比较,GPT-3.5遥遥领先   理解了心智理论的概念,也看了论文的方法,咱们再来说说网上的解读。九岁的"心智理论" "同理心" "心智" "智力"这些说法哪个靠谱?   "心智理论"显然是最比较准确的解读 ,论文中测试的就是心智理论这个能力。   "同理心"则有一点偏差 ,心理学家认为,心智理论和同理心是两种相近的能力,但同理心更偏重情绪和情感的体验。以ChatGPT为代表的大语言模型并不具备情绪能力,也就不具备通常所说的同理心。   "心智"的偏差就更大了 ,在心理学领域,心智是一个"大词",指的是人具备思想、想象力、记忆、动机、感觉等,对于人类的心智究竟是什么,科学家还在争论。心智理论和心智共享了相同的字眼,意思却很不一样。显然,目前的大语言模型还不需要具备心智,但通过心智理论测试却没问题。   最后,"智力"这个解读也很不准确 ,科学家并没有进行智力测试,智力和心智理论是两个完全不同的概念 。   03
  ChatGPT没有心智,就不厉害吗?   看来, GPT-3.5虽然取得了一系列突破性的进步,但也不能过分解读,某一项特殊能力提升和九岁孩子的心智之间,有巨大的差异。而且,对于ChatGPT这类模型的争论也不少。著名人工智能专家杨立昆(Yann LeCun)就认为,ChatGPT和前几年的人工智能并没有本质上的突破。另一位著名人工智能专家侯世达(Douglas Hofstadter)则更为激进,他早在多年前就否定了ChatGPT等一系列人工智能的研究路线。他认为,这类人工智能是利用数学模型获得好的测试效果,但不论怎么演变,也不可能像人一样获得心智 。   类似的争论还有很多。不同领域的学者,还有很多投资人都十分关心, GPT-3.5的后续版本还能取得多大进步,能不能产生类似心智的能力呢?至少目前还也未可知。不过,我想提醒大家,这篇论文的标题中,还有另一个关键词也值得细究,那就是"自发涌现"。这个词的意思是许多要素组成系统后,自发出现了原本没有的特性。人们经常为了特定的任务编写人工智能,比如下棋的人工智能、开车的人工智能等等。以ChatGPT为代表的大语言模型处理的是自然语言,在设计时并不是为了应付心智理论测试的,但是,它自己就具备了靠语言通过测试的能力。   这个结果,可能要比ChatGPT相当于几岁孩子更为重要。过去,很多人工智能专家希望先理解人类的大脑和心智,再用机器模拟出来。可是,人类的大脑实在是太复杂了,凭目前人类的心智,居然没法理解。然而,大语言模型告诉我们,就算弄不清人类是怎么说话的,人们还是可以教会电脑说话。甚至,电脑在学说话的时候,就自己学会了其他本领。   在许多科学家眼里,今天的人工智能却是像一个九岁小孩,真是未来可鸡,啊不,可期呀。   参考文献:   [1]Kosinski,M. (2023). Theory of Mind May Have Spontaneously Emerged in Large Language Models (arXiv:2302.02083). arXiv   [2]Premack, D., & Woodruff, G. (1978). Does the Chimpanzee Have a Theory of Mind? Behavioral and Brain Sciences, 4(4), 515–629.   [3]Gopnik, A., & Astington, J. W. (1988).Children’s understanding of changes in their mental states. Child Development, 62, 98–110.   [4]Baron-Cohen, S., Leslie, A. M., & Frith, U. (1985).Does the autistic child have a "theory of mind". Cognition, 21(1), 37-46.   作者|陈朝 北京师范大学认知神经科学硕士   审核|唐义诚 北京中科普心理健康促进中心副主任   出品:科普中国-创作培育(星空计划)

六方云获亿元C1轮融资客户体验平台Emplifi收购PixleeTurnTo文宋思杭11月2日,据牛透社不完全统计,全球SaaS领域共发生7起融资,其中,国内4起,国外3起,涉及医学物联网安全教育云计算等领域。在国内,网络安全公司六方云获2亿元C1轮融资,科林电气光伏逆变器储能充电桩,底部蓄势,会是潜力黑马吗随着碳中和碳达峰的推进,以光伏为代表的新能源产业近2年得到了飞速发展,A股市场上也出现了很多不错的公司,特别是光伏逆变器和储能赛道方向。根据乘联社发布的10月份汽车销量数据,各大车高管薪酬砍半,这家车企还能坚持多久?新能源车企11月销量公布月初,新能源车企的销量陆续公布,几家欢喜几家愁。先来看新势力这边,哪吒汽车10月卖出18016辆领跑新势力销量榜单,在其之后分别是10056辆的蔚来100540分钟完成去年全天销售额,白云电商企业双十一首战告捷一年一度的双十一电商购物节如期而至,各大平台打出不熬夜的口号,自10月31日晚8点起,掀起首波付尾款订单热潮。白云电商企业品牌表现亮眼骆驼品牌在开战40分钟内就完成去年同期一天的销锦鲤滞销?天猫双11上线拍照锦鲤玩法,将诞生100万幸运儿天猫双11如火如荼,1700万商品集体打折淘宝升级购物车天猫升级价保服务种种变化与新玩法背后,是对消费者体验的持续优化。与此同时,天猫还公布了许多游戏的新玩法,其中最简单有趣的莫过深扒软件行业会发现,程序员不是神仙职业,而是一种新型工人这年头,高考后,很多考生会被建议说学开发当程序员,就业前景好,高薪职业,又不用和人打交道,人才缺口大,随便开个招聘网站,只要输入个什么JAVAnet什么的,就能出来好几十页招聘信息电子龙舟如何划得快?科研人员有了新发现小型化自由电子相干光源中科院上海光机所供图中新网上海11月3日电(记者郑莹莹)当今人类科技的发展,离不开激光技术的不断进步。北京时间11月3日,自然杂志(Nature)发表了中国科java的基础语法,以及变量的概念Java基础语法1变量1。1问题1变量的概念2变量的作用3变量的定义格式1。2答案1。2。1概念变量就是内存中的存储空间,空间中记录着经常发生改变的数据1。2。2作用用于在内存中保特斯拉关闭中国首家门店电动汽车巨头特斯拉(TeslaInc。)近日关闭了中国首家旗舰展厅北京侨福芳草地的体验中心。知情人士表示,特斯拉公司已经调整其在中国的销售和服务策略。特斯拉周三(11月2日)向路透工厂人员工装穿戴识别工厂人员工装穿戴识别依据大规模不同外观工装数据识别训练,工厂人员工装穿戴识别与现场已有监控摄像头互相配合监控现场人员着装情况,燧机工厂人员工装穿戴识别一旦发现工作中人员并没有按照要小度发布添添自由屏,超大屏AI将成平板未来?孵化自百度智能生活事业群组业务的小度科技,在小度智能音箱和小度智能屏将小度小度交互口令带入大众视野,推出学习机健身镜等创新硬件之后,于2022年双11期间带来了最新的年度新品添添自
请放下手机捧起书本王吉中习近平总书记说读书可以让人保持思想活力,让人得到智慧启发,让人滋养浩然之气。曾几何时,读书成为一道道亮丽的风景。在公园里火车上路灯下,总能看到静静的读书人。每每看到这些,我的寒气逼人的一周,问题出在哪?券商赚手续费已成过去式,做市商才是证券公司的亮点,这几年暗地里做,现在可以拿正牌做了,证监会首批8家。那么,什么是市商呢?市商就是指做市商,做市商就是指股价的中间商(具备一定实力和致6死,特大命案告破1987年3月,一艘搁浅在浙江舟山定海区南部海域摘箬山岛的渔船船舱内,有多处血迹和钝器敲打痕迹,船上6名船员失踪,船员携带的货款下落不明。经警方现场勘查,分析系一起特大抢劫杀人案,一场大火牵出长沙电信大楼的前身,竟是一座腐败楼9月16日下午,位于湖南长沙市区内的中国电信大楼发生火灾,受到广泛关注。据央视报道,现场浓烟滚滚,数十层楼体燃烧剧烈。现场为芙蓉区荷花园电信大厦外墙起火,建筑高度218米,地上42AG一诺关羽四杀名场面再现?雷霆杯导演搞事情,一诺无辜躺枪9月3日KPL夏季赛总决赛正式开启,无论是狼队夺冠还是eStar夺冠,这场比赛结束以后意味着KPL比赛正式告一段落了。不过虎牙举办的第五届雷霆杯比赛已经开赛,虽然只是平台比赛,但雷火影策划说重磅来袭,神秘嘉宾首次亮相?活动细节曝光自从火影忍者手游正式上线国服以来,依靠其独特的玩法风格随即便在国内手游领域当中占据一席之地,在此期间也凭借正版IP的头衔成功吸引到全网火影迷的青睐。与此同时这款游戏之所以能够在上线物资采购很重要仙剑客栈2物资采购准备阶段玩家可以派伙计去镇上活动,指派的伙计需要消耗25点体力。之后在开店经营前,就可以重复在客栈镇上往返。镇上不同的商人贩卖的物资各有不同。其中比较特殊的是货船商人,货船EDG晋级世界赛随着LPL季后赛的逐步推进,获胜者和失败者的决赛的结果发布之后也意味着2022LPL夏季比赛即将结束。JDG和TES都晋级了S12全球总决赛,两支球队已经进入LPL夏季决赛。RNG宇智波带土上线在即,火影策划说空降大佬,涵涵和倾月要吊打策划想必资深火影忍者手游的玩家都知道了,最新的版本宇智波带土忍界大战马上就要上线了,为了能让众多玩家更加深入的了解新版本,虎牙官方特地联合火影手游官方举办了最新一期的火影策划说。在9月原神秘宝迷踪活动来袭,420原石5种限定仙灵,萌新玩家别错过哈罗大家好,我是盟盟,本期和大家聊聊原神的话题。相信很多刚玩原神的小伙伴,都见过这样的场景,玩家的角色旁边除了有派蒙,还有一只会发光有特殊音效而且还会一直跟着角色跑图和解密的小仙灵对直播观看人数的疑问今晚在看王者荣耀土鸡德华的直播,看了直播人数,我忽然想起来算算这类直播软件真的有这么多人看吗?光王者荣耀,我看了这些主播的人气,从头到尾大大小小主播拉了一遍,至少在七八千万人,这还