GPT4和前一代比到底有什么不同?
记者 | 张司钰
编辑 | 倪 妮
当开发者还在为OpenAI开放ChatGPT的API(应用程序编程接口)兴奋,铆足了劲研究各种AI插件之时,OpenAI在北京时间3月15日凌晨发布了多模态预训练大模型GPT-4(Generative Pre-trained Transformer 4),支持图像和文本输入并以文本形式输出。
不过,目前只有ChatGPT Plus的订阅用户可以试用有使用上限的GPT-4,想要访问GPT-4 API的开发者也需加入候补名单等待。由于目前的图像输入尚处于只供内部测试使用的第一阶段(α阶段),用户暂时只能向其输入纯文本信息。
在定价方面,对于订阅用户来说,GPT-4的定价为每1000个prompt token(用于文本生成的特定文本片段或单词)0.03美元,每1000个completion token(语言模型基于prompt token生成的完整文本)0.06 美元。
那么,GPT-4与之前"技惊四座"的GPT-3.5有什么不同?它又会让目前的AI应用产生怎样的变化?
首先是语言模型架构的不同:GPT-4使用多模态预训练大模型,输入不只限于文本,而GPT-3.5采用的是基于文本的单模态预训练模型。
当人们谈论GPT-4的高体验、强能力时,往往提及GPT-4针对文本、图像多种类型输入数据的强大的处理能力,这主要基于其特有的"多模态"功能。
虽然GPT-3.5已经具备很强的文本理解与生成能力,但它只是GPT-3微调的版本,它们有着相似的架构,即使增加了更多的参数,GPT-3.5仍然是一个单模态预训练模型,无论是图像还是文本、音频,用户只可以输入一种数据类型的信息。
GPT-4则非常不同。假使我们让计算机根据一张照片描述其中的物品,如果使用单模态预训练模型,计算机只能从图像中提取特征并生成描述,这样很容易出现"误判"。但如果使用多模态预训练模型,同时提供图片与相关文本描述,计算机就可以结合两类信息生成更准确的描述。
在OpenAI公开的 GPT-4报告 中,用一张带梗的图片演示了GPT-4特有的多模态功能:
比如用户输入:Can you explain this meme?(你可以解释这张网络爆火的图片吗?)
基于GPT-4的ChatGPT给出的回答是:这个梗将两个毫不相干的事物组合在一起,即从太空拍摄的地球照片和鸡块。文字暗示下方的图片是一张美丽的从太空拍摄的地球照片。然而,实际上这张图片是鸡块拼凑而成,模糊地呈现出世界地图的形状。这个梗的幽默之处在于文字和图片之间出现了出乎意料的差异。文字制造了一种期望,即展示一幅壮丽的地球图像,但实际呈现的是一些平凡而又滑稽的东西。
同样,在翻译领域,用户可以向多模态预训练大模型提供文本与音频,而非之前基于单模态预训练大模型只能提供文本或音频,计算机结合多种输入数据类型分析,可以生成更准确的翻译结果。在文献阅读过程中,用户也可以直接输入文献的图片格式与文字指令,使其总结论文要点。
其次是训练数据来源不同:GPT-4使用文本、图像、视频等多种类型,回答更具针对性,而GPT-3.5只有文本。
ChatGPT的爆火,展现了GPT-3.5在各种自然语言处理任务中出色的性能,以及在多个任务中与人类不相上下的文本理解与文本生成能力,但GPT-4让生成的内容更具针对性了。
对于模型的训练数据,GPT-3.5使用的是来自互联网的大量文本数据,这些数据包括维基百科、新闻报道、网站文章等。GPT-4使用的则是包括图像、视频、语音等多种类型的数据。比如,GPT-4可以通过分析视频和音频内容,学习不同的语音和口音模式,从而提高其对口语的理解和生成能力。
正因如此,OpenAI在介绍GPT-4的页面写道,"GPT-4 比以往任何时候都更具创造力和协作性。它可以生成、编辑和迭代用户进行创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。"
为了佐证相比GPT-3.5,拥有更大模型容量和更高计算能力的GPT-4可以处理更复杂、更长的输入信息,并生成更准确、更流畅的输出内容,OpenAI在报告中提到,经过6个月使用对抗性测试程序(Adversarial Testing,为确保机器学习模型不会对恶意数据产生过于错误的预测或输出,从而增强机器学习模型的安全性和稳健性)并参考ChatGPT的经验教训,GPT-4在真实性和可控性等方面取得了有史以来最好的成果。
如今,GPT-4能够通过模拟律师考试,其分数在应试者的前10%左右;相比之下,GPT-3.5的得分在倒数10%左右。并且,GPT-4也在USABO Semifinal Exam 2020(美国生物奥林匹克竞赛)、GRE口语等多项测试项目中取得了接近满分的成绩。
知识在计算机中如何表示是人工智能领域的核心问题之一,以前这个问题通过关系型数据库的方式解决,但BERT、GPT等预训练模型的出现提供了另一种可能——大模型也成为一种知识存储的方式:知识以参数的方式存储,虽然可读性、精度相对较低,但通过自然语言就能调用。
虽然GPT-4还没有被广泛使用,但随着该模型的出现,语言交互系统将变得更加高效。如今,GPT-4可以处理超过25000字的文本,这意味着它可以处理上下文较长的对话,而不会迷失或混淆。到那时,当我们向智能客服提问的时候,应该不会只得到根据关键词自动回复的固定内容,让人着急上火对它大吼"给我转人工客服";当我们与聊天机器人对话的时候,它也不会太频繁地说驴头不对马嘴的话,或者经常在回答不上来的时候转移话题。
OpenAI称,GPT-4是在Microsoft Azure AI超级计算机上接受训练的,具有Azure的"AI优化"基础架构,因此可以面向世界各地的用户提供此项服务。微软也表示,其Bing AI Chatbot自上个月该服务进入预览版以来一直基于GPT-4运行。
不过很遗憾的是,虽然在内部的真实性评估中,GPT-4的得分比GPT-3.5高40%,但GPT-4并不能让生成的内容绝对符合事实,它与GPT-3.5乃至早期的GPT模型一样不完全可靠。
OpenAI也在GPT-4的报告中用17页的内容(占据全篇近20%)着重强调了这一点(报告中对应:GPT-4 Observed Safety Challenges这一小节)。比如它仍然会产生虚假信息、有害内容、"幻觉"(产生"幻觉"事实并出现推理错误)、传统或非传统武器扩散、隐私、网络安全、过度依赖等问题。
本文版权归第一财经所有,
未经许可不得转载或翻译。
即可购买《第一财经》杂志2023年3月刊
90后停用智能手机一年半换了2部老年机,出门带手电等一堆工具1hr不知从什么时候起,智能手机成了每个人的标配。如果没有智能手机,出门没法扫自行车,也没法扫健康码,付钱只能用现金,工作消息也无法及时回复。然而,29岁的Leon却决定停止使用智
五条人仁科通俗小说出版那些像塑料袋一样飘荡的人我一直在琢磨如何才能写好小说,虽然我也不知道我能否做好,但这个事情一直在发生,我一直在写。仁科作为五条人乐队的主唱兼吉他手手风琴手,仁科除了是个真性情的音乐人,他还有不为人知的另一
赋能智慧,深圳新一代产业园助力园区企业抢滩智能会议音箱随着数字化时代的到来,数字化办公工具已成为企业数字化转型发展的基座。伴随着数字化场景的不断升级和迭代,企业对于全流程打通,打破信息壁垒的要求日渐提高。日前,深圳新一代产业园产业合伙
实名制的手机卡,不用了一定要注销吗?移动内部员工给出了答案每个人的手机里边都装有手机卡,每个手机卡对应一个手机号,如果我们的手机号码不使用了,到底需不需要去注销掉呢?我也是才知道,赶紧跟着小编一起来了解一下吧。我们每个人的身份证可以办理五
行业先锋!金煌装配式28天装好一套房日历翻到岁末,目前离元旦不足一个月,离春节差不多一个半月,不少近期收房的业主开始困扰习俗上大家都喜欢过年住新家,新房拿到钥匙了,业主当然也会有春节在新房招待亲朋的愿望。然而,一般装
承诺书签订!黄江对学校食品安全工作提出新要求12月8日,黄江镇委副书记镇长李冠洲带队前往东莞市海德实验学校,督导检查食品安全工作。黄江镇副镇长丁奕君,镇食药安办市场监管分局教育管理中心及海德实验学校负责人陪同检查。督导组听取
特写共品中国茶香共绘生物多样性治理蓝图新华社加拿大蒙特利尔12月8日电特写共品中国茶香共绘生物多样性治理蓝图新华社记者郭爽林威陈琛在中国云南海拔超过2000米的高山净土,融云雾甘露的千年古茶树枝条之上,叶片被精心采摘发
迟来的致歉保护生物多样性月华正浓,星河灿灿。夜阑人静,周身一派安谧。忽而冷风袭来,凉意侵扰着心扉,不禁嘲笑起自己的弱不禁风。猛然间,忆起了那些悄然而逝的挚友,叹惋着这凡世红尘中皆若蜉蝣般的生灵,远方的朋友
称重传感器销售前景分析称重传感器被称为电子衡器中的心脏部件。科学技术的飞速发展,由称重传感器制作的电子衡器也已广泛地应用到各行各业,实现了对物料的快速准确的称量。特别是随着微处理机的出现,工业生产过程自
杭州医药港如何撬动万亿目标?生物医药产业探索链式集群发展新模式生物医药产业被称为21世纪的朝阳产业,成为经济发展的新引擎和各地激烈争夺的战略制高点,尤其是在长三角,不少城市已经提出发展目标并加快布局。2020年,苏州就发布生物医药及健康产业地
加快数字化转型,支付机构这样发力数字化变革驱动着支付产业升级,支付机构持续探索数字化生态建设的方向。银联商务商业科技部总经理杨继业近日在银联商务2022年纵衡论坛上表示,从银联商务的具体实践来看,方向之一就是Sa
白眉大侠中,三教堂大堂主翻掌震西天方天化和二堂主铁掌霹雳子詹风分别是什么下场?卧佛昆仑僧试图拉三教堂堂主上贼船山西万里白树林三教堂有三个堂主,分别是大堂主翻掌震西天方天化二堂主铁掌霹雷子詹风詹明奇三堂主肩担日月携昆仑陈仓。三教堂是陈仓通过化缘一点点募集三十万
为什么黑暗之魂里的Boss都比主角巨大很多?黑暗之魂系列中的绝大多数BOSS都比主角大很多,最主要是因为巨大的BOSS更有视觉冲击力,打败BOSS后会给玩家更多成就感。但同时,宫崎英高这种设定控在故事背景上也有所解释(黑魂2
放弃和平精英和王者荣耀,还有什么热门游戏可以玩,求推荐几款?如果你喜欢fps射击类游戏一穿越火线枪战王者老IP,老游戏,手机上焕发的第二春生化,爆破,挑战,你想要的都有。二,王牌战士最近刚公测,漫画风格,传统fps游戏又加了moba因素,每
夫妻一方手机不许另一方碰是什么心理?夫妻一方手机不许另一方碰,这显然是有点不正常了。但是,对于这个问题也不可以以偏概全,也有可能只是偶尔一次。01需要给彼此留点私人空间,但是需要建立在信任的基础上即使是再恩爱的夫妻,
传销是怎样工作的?他们的生活又是怎样的?传销一般大体分为两大类型一类是南派传销,有代表性的就是新闻中经常提到的,1040阳光工程,资本运作,连锁经营等。投资69800块,拿着一百块的人民币,对着一百块人民币上的图案解释,
詹姆斯的时代结束了?老詹还有机会染指总冠军吗?今天,洛杉矶湖人队继续着他们的常规赛征程,对手是印第安纳纳步行者队。在上一场比赛,湖人队惜败给了纽约尼克斯队,詹姆斯因为在对阵底特律活塞队的时候肘击对方年轻中锋以赛亚斯图尔特,吃到
你最喜欢的球队(足球球队)是哪支?你可以说出借口吗?谢谢邀请。虽然我是山东鲁能的球迷,但实事求是地说,我比较喜欢广州恒大队。因为恒大队管理合理,竞争机制突出,球员积极性高,队内充驰着一种永不言败,永争第一的良好氛围。抛开金钱因素,有
有哪些能够提升自己的APP?自我提升类1。Quora(外国版知乎,适宜人群所有人)国版的知乎,里面同样活跃着各种不同阶层的人,都在奉献自己的专业知识。里面有很多有意思的回答,与此同时,也可以提高你的英语阅读能
宝宝经常起湿疹怎么办?分享一个湿疹临床病例,或会对大家有所帮助!接诊到一个宝宝,一岁六月,母乳喂养,过敏性体质,生下来就发湿疹。跟我说起来时,不停地掉眼泪。四个月大的时候,浑身皮肤干燥,没有一块好皮肤,
孕妇怀孕期间该吃什么,不应该吃什么?多多的謝谢大师兄啦!您怎么拿这事儿难为咱老虎啊?五十老虎是雄的!能怀孕吗!您要是不着急,能等上一年,等咱见着雌老虎问一问吧!非要让说真话就两字儿吃肉!猴哥真会逗哏儿!怀孕了应该不吃
一个人可以去深山吗?有多危险?我曾经自己一个人无数次去过深山,那是十年前的事情了。那个时侯去深山感觉不怕,不象现在山上己经没有路可走了,十年前的山还有路进去,冬天的时候,去砍柴,那杂草比人还高,就用脚踩草扁了就