范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

ChatGPT的崛起从GPT3,AIGC时代即将到来

  ChatGPT是个啥?
  近期,OpenAI 发布了 ChatGPT,是一个可以对话的方式进行交互的模型,因为它的智能化,得到了很多用户的欢迎。
  ChatGPT 也是 OpenAI 之前发布的 InstructGPT 的亲戚, ChatGPT  模型的训练是使用 RLHF(Reinforcement learning with human feedback)也许  ChatGPT 的到来,也是 OpenAI 的 GPT-4 正式推出之前的序章。 什么是GPT?从GPT-1到GPT-3
  Generative Pre-trained Transformer (GPT),是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话 AI。 2018年,GPT-1 诞生,这一年也是 NLP(自然语言处理)的预训练模型元年。 性能方面,GPT-1 有着一定的泛化能力,能够用于和监督任务无关的 NLP 任务中。 其常用任务包括: 自然语言推理:判断两个句子的关系(包含、矛盾、中立); 问答与常识推理:输入文章及若干答案,输出答案的准确率; 语义相似度识别:判断两个句子语义是否相关; 分类:判断输入文本是指定的哪个类别;
  虽然 GPT-1 在未经调试的任务上有一些效果,但其泛化能力远低于经过微调的有监督任务,因此 GPT-1 只能算得上一个还算不错的语言理解工具而非对话式 AI。 GPT-2 也于 2019 年如期而至,不过,GPT-2 并没有对原有的网络进行过多的结构创新与设计,只使用了更多的网络参数与更大的数据集:最大模型共计 48 层,参数量达 15 亿,学习目标则使用无监督预训练模型做有监督任务。 在性能方面,除了理解能力外,GPT-2 在生成方面第一次表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。 在"变得更大"之后,GPT-2 的确展现出了普适而强大的能力,并在多个特定的语言建模任务上实现了彼时的最佳性能。
  之后, GPT-3 出现了,作为一个无监督模型(现在经常被称为自监督模型),几乎可以完成自然语言处理的绝大部分任务 ,例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。而且,该模型在诸多任务上表现卓越,例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器(仅52%的正确率,与随机猜测相当),更令人惊讶的是在两位数的加减运算任务上达到几乎 100% 的正确率,甚至还可以依据任务描述自动生成代码。 一个无监督模型功能多效果好,似乎让人们看到了通用人工智能的希望,可能这就是 GPT-3 影响如此之大的主要原因。 GPT-3 模型到底是什么?
  实际上,GPT-3 就是一个简单的统计语言模型。 从机器学习的角度,语言模型是对词语序列的概率分布的建模,即利用已经说过的片段作为条件预测下一个时刻不同词语出现的概率分布。语言模型一方面可以衡量一个句子符合语言文法的程度(例如衡量人机对话系统自动产生的回复是否自然流畅),同时也可以用来预测生成新的句子。例如,对于一个片段"中午12点了,我们一起去餐厅",语言模型可以预测"餐厅"后面可能出现的词语。一般的语言模型会预测下一个词语是"吃饭",强大的语言模型能够捕捉时间信息并且预测产生符合语境的词语"吃午饭"。 通常,一个语言模型是否强大主要取决于两点: 首先看该模型是否能够利用所有的历史上下文信息 ,上述例子中如果无法捕捉"中午12点"这个远距离的语义信息,语言模型几乎无法预测下一个词语"吃午饭"。 其次,还要看是否有足够丰富的历史上下文可供模型学习,也就是说训练语料是否足够丰富 。由于语言模型属于自监督学习,优化目标是最大化所见文本的语言模型概率,因此任何文本无需标注即可作为训练数据。
  由于 GPT-3 更强的性能和明显更多的参数,它包含了更多的主题文本,显然优于前代的 GPT-2。 作为目前最大的密集型神经网络,GPT-3 能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的各位哲学家——预测生命的真谛。且 GPT-3 不需要微调,在处理语法难题方面,它只需要一些输出类型的样本(少量学习)。 可以说 GPT-3 似乎已经满足了我们对于语言专家的一切想象。 GPT-3 存在什么问题?
  但是 GTP-3 并不完美,当前有人们最担忧人工智能的主要问题之一,就是聊天机器人和文本生成工具等很可能会不分青红皂白和质量好坏地对网络上的所有文本进行学习,进而生产出错误的、恶意冒犯的、甚至是攻击性的语言输出,这将会充分影响到它们的下一步应用。 OpenAI 也曾经提出,会在不久的将来发布更为强大的 GPT-4:
  将 GPT-3 与 GPT-4、 人脑进行比较(图片来源:Lex Fridman @youtube)
  据说,GPT-4 会在明年发布,它能够通过图灵测试,并且能够先进到 和人类没有区别 ,除此之外,企业引进 GPT-4 的成本也将大规模下降。
  ChatGPT 与 InstructGPT
  谈到 ChatGPT,就要聊聊它的"前身"InstructGPT。
  2022 年初,OpenAI 发布了 InstructGPT,在这项研究中,相比 GPT-3 而言,OpenAI 采用对齐研究(alignment research),训练出更真实、更无害,而且更好地遵循用户意图的语言模型 InstructGPT。 InstructGPT 是一个经过微调的新版本 GPT-3,可以将有害的、不真实的和有偏差的输出最小化。 InstructGPT 的工作原理是什么?
  开发人员通过结合监督学习+从人类反馈中获得的强化学习, 来提高 GPT-3 的输出质量。在这种学习中,人类对模型的潜在输出进行排序;强化学习算法则对产生类似于高级输出材料的模型进行奖励。 训练数据集以创建提示开始,其中一些提示是基于 GPT-3 用户的输入,比如"给我讲一个关于青蛙的故事"或"用几句话给一个6岁的孩子解释一下登月"。
  开发人员将提示分为三个部分,并以不同的方式为每个部分创建响应: 人类作家会对第一组提示做出响应。开发人员微调了一个经过训练的 GPT-3,将它变成 InstructGPT 以生成每个提示的现有响应。 下一步是训练一个模型,使其对更好的响应做出更高的奖励。对于第二组提示,经过优化的模型会生成多个响应。人工评分者会对每个回复进行排名。在给出一个提示和两个响应后,一个奖励模型(另一个预先训练的GPT-3)学会了为评分高的响应计算更高的奖励,为评分低的回答计算更低的奖励。 开发人员使用第三组提示和强化学习方法近端策略优化(Proximal Policy Optimization, PPO)进一步微调了语言模型。给出提示后,语言模型会生成响应,而奖励模型会给予相应奖励。PPO 使用奖励来更新语言模型。 重要在何处?
  核心在于——人工智能需要是能够负责任的人工智能。
  OpenAI 的语言模型可以助力教育领域、虚拟治疗师、写作辅助工具、角色扮演游戏等。在这些领域,社会偏见、错误信息和毒害信息存在都是比较麻烦的,能够避免这些缺陷的系统才能更具备有用性。 ChatGPT 与 InstructGPT 的训练过程有哪些不同?
  总体来说,ChatGPT 和上文的 InstructGPT 一样,是使用 RLHF(从人类反馈中强化学习)训练的。  不同之处在于数据是如何设置用于训练(以及收集)的 。(这里解释一下:之前的 InstructGPT 模型,是给一个输入就给一个输出,再跟训练数据对比,对了有奖励不对有惩罚;现在的  ChatGPT  是一个输入,模型给出多个输出,然后人给这个输出结果排序,让模型去给这些结果从"更像人话"到"狗屁不通"排序,让模型学习人类排序的方式,这种策略叫做 supervised learning,本段感谢张子兼博士。)
  ChatGPT 存在哪些局限性?
  如下:
  a)  在训练的强化学习 (RL) 阶段,没有真相和问题标准答案的具体来源,来答复你的问题。
  b)  训练模型更加谨慎,可能会拒绝回答(以避免提示的误报)。
  c)  监督训练可能会误导/偏向模型倾向于知道理想的答案,而不是模型生成一组随机的响应并且只有人类评论者选择好的/排名靠前的响应
  注意:ChatGPT 对措辞敏感,有时模型最终对一个短语没有反应,但对问题/短语稍作调整,它最终会正确回答。训练者更倾向于喜欢更长的答案,因为这些答案可能看起来更全面,导致倾向于更为冗长的回答,以及模型中会过度使用某些短语,如果初始提示或问题含糊不清,则模型不会适当地要求澄清。
  来源:https://mp.weixin.qq.com/s?src=11×tamp=1670297402&ver=4209&signature=K2rascq-O48M2JVvk1KwWV746heycx0kFllQnnZT2jYSC*dbdwS5S8X6TErw1XOh3-*wo7kEcUzk24v*fV2Wc5K0FnQnj7jp52fhjNIX8j1E9vZQ9Rf30t5QwNRukyGK&new=1

千商齐聚馥郁大会2023年酒鬼酒打算这么干深圳是中国改革开放的前沿阵地,馥郁大会在此召开,体现了酒鬼酒执着敢为追求卓越的精神追求,这是借鹏城之魂展青云之志的誓师大会,是以酒会友共叙桑麻的联谊大会,更是厂商携手共建市场共商大火山爆发前会有哪些前兆?火山爆发前可能会出现多种前兆,以下是一些常见的前兆1震动火山可能会因为岩浆和气体的运动而产生震动。这些震动可能被监测仪器记录下来。2热点火山可能会因为岩浆上升而产生热点。这些热点可论全球大脑赫伯特乔治威尔斯和谷歌最雄心勃勃的失败文慢纪硬核说编辑慢纪硬核说引言哲学家们一直梦想有一个宇宙世界大脑一个可以综合所有人类知识并使之民主化的东西?几个世纪以来?互联网可能是我们最接近实现这一抱负的方式,但它的兴起也导致超威电池续航怎么样?尖端科技赢得行业充分认可!在日前举行的雪乡极限寒战第二季活动中,行业龙头中国超威与立马电动车密切配合积极协作,在30的极限低温与险峻崎岖的路况下,创造了110。4km仍有余电的绝佳战绩。那么作为浙江板块电动蹭上ChatGPT?2023年,百度的能力和野心摘要游戏一方面也才开始,另一方面早就开始了(欢迎关注杠杆游戏)撰文张银银编辑欣欣然在中国版ChatGPT概念加持下,百度近期或主动或被动,让自己受到非常多的关注。近些年,百度行业老美国电车新贵也卖不动了电动车市场开年即掀起血腥的价格战,特斯拉率先相继下调中日美欧市场的售价,其他车企被迫跟进。在过去两年蓬勃发展的美国电车新贵们,在马斯克不讲武德的降价面前节节败退。当地时间周三,电动京通可以办理社保缴费了!快来看看近日,支付宝百度京通健康宝小程序社保费办理业务正式上线了。您可以登录支付宝百度客户端,关注京通健康宝小程序,进入社会保障栏目,使用社保费办理功能,办理城乡居民基本医疗费灵活就业人员你能接受终身租房吗?我国会出现租房一代吗?文维辰近四成青年群体接受终身租房,我国会出现租房一代吗?媒体日前报道,北京航空航天大学公共管理学院副教授聂晨调查认为,一线城市房价长期高位运行,加上近年来就业市场波动,若完全放任租洞见科技薛婧出席信通院隐私计算分享会,畅谈互联互通应用实践近日,为进一步探究我国隐私计算应用发展现状,分析当前各行业隐私计算应用发展中存在的问题及解决方案,探索隐私计算在新领域新场景中的应用,为数据流通共享的安全合规提供强力支撑,由中国信人类实体能不能直接以光速前进?人类实体能不能直接以光速前进?根据当前我们对物理学的了解,人类实体不能直接以光速前进。这是因为光速是宇宙中最快的速度,同时也是物质和信息传输的极限速度。根据狭义相对论的理论,当物体维埃拉表现太过优异,阿尔特塔都觉得出现人员选择性困难了球员表现很好,让阿尔特塔非常头疼!这是好事呀。最近阿尔特塔透露,由于维埃拉最近一系列稳定的表现后,让他在决定球队人选的时候感到非常头疼。去年夏天维埃拉以3500万英镑的价格从波尔图
对于石家庄未来发展,您最期待哪些方面的改进提升?建议石家庄多建林荫公园林荫大道,通过建设林荫城市,弥补北方城市普遍存在的自然环境方面的短板。滹沱河两岸要多建设水景森林公园。应杜绝建设水泥石材铺装的广场和大片的草地。我认为石家庄最为什么农村人喜欢把大门打开,而一些城里人总是把门关着,你怎么看?开着门过日子还是关着门过日子?这其实是一个如何做人?的问题。村里老一辈儿人常说,咱们老百姓过日子,其实就是关门开门。关上门,能把家里的事情处理好打开门,能将外面的事情摆平。如果一个5月退休人员养老金暂停发放且每人会发800元过节补贴,是真的吗?谣言。别信別传!我是江苏人,我们这不会,我想全国也不会。全国两会上以及有关政策法律,从来都强调养老金按时足额发放。过什么节发800补贴,国家也没有这规定。除非某地有什么特殊情况,那我去年退休了,退休工资1800元,想不上班,生活会怎么样?仅领1800元的退休金,说明你一是工龄短,二是交的养老保险金低,至于想不想干活,那是你自己的事,不用别人替你操心。这样的事也拿出来讨论,纯属无聊死了。不管多少钱退休就不干了,有多用哪一段记忆使你记忆深刻?其实人生中有很多记忆深而且每一段经历都不一样会触发不同的感觉!记得那一年的高二的时候我正在读书然后也是期中考试,然后被三个女孩子拉下那个球场里打球打着打着到10点,然后宿舍休息的时既然城市好,为什么很多在城里有房有车的农民却不选择把户口迁入城市?落不落户没什么关系,都改革开放了城乡一体化了,户口统一为居民户口,不区分城市户农村户了。大城市落户是有门坎的,小城市没什么发展,还有土地,可以种地哟。农民虽然说在城市买了房,也不是生肖羊最害怕发生什么事?生肖羊心地善良,性格温顺,孝顺父母,重情重义,乐善好施,喜欢学习,善于思考,有极大的包容心,能够原谅包容别人,宁愿自己吃亏,也不让别人吃亏,为人厚道,外表懦弱,多愁善感,容易睹物思说一下自己请客的事儿,有什么难忘的故事?十多年前在外打工,记得有一次邀请包工头夫妇天黑吃饭,意在感谢他承揽工程,交一部分工程给我施工,请客还是非常熟悉的人吃顿便饭两三个人七八百元钱就够了,因为都是打工的人,即不是贵客,也在太原哪里买了房后特别后悔?我自己的看法是富力城八号园,从买了这里的房子后,肠子都快悔青了!吃瓜群众,速来围观之前一直有听过富力城的事情,当时觉得离自己很遥远,等买了富力的项目后,才真正的感觉到无望,终于明白太原的中考体育测试会取消吗?只能取消。太原的中考体育测试会取消吗?本着负责任的态度,老穆上网查了一下,还没有发现取消体育中考的通知。但老穆看到了太原市2022年初中阶段学业考试(体育部分)工作实施方案公布了。抑郁症发作时什么感觉?当一个抑郁症患者发病时,是处在担忧和焦虑之中的,思想和心态不能维持集中,而随着所想抑郁的心情和状态也是起伏不定,甚至,影响生活直至干任何事情都不会有什么功效或结果。例如,日常的无精