范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

旷视科技研究院张祥雨ChatGPT核心逻辑在于规模化效应

  本报记者 曲忠芳 李正豪 北京报道
  "ChatGPT自2022年11月发布以来,我基本上每天都在使用。我主要关注它的逻辑推理能力,而不仅仅是它拥有哪些知识。我认为,逻辑推理能力对判断一个模型是否达到了类似人的思维水平更重要。"近日,通用型对话机器人ChatGPT持续火热,旷视科技研究院基础科研负责人张祥雨在接受《中国经营报》记者采访时说道。
  张祥雨通过体验与观察注意到,ChatGPT在语言逻辑推理,尤其是在多轮对话以及高阶指代关系推理方面具有很强的能力。另外,它也存在一些问题,主要是在常识建模尤其是数学逻辑能力比较欠缺,对数字的敏感性(比如大小关系等)不强。"总体来看,ChatGPT的能力超出了预期。"
  针对当下全民关注ChatGPT的火爆现象,业界有一种较高的呼声是,它正在带动AI(人工智能)新一轮发展浪潮的看法。在张祥雨看来,引发AI新一轮浪潮的不止是ChatGPT——它只是大模型技术的一种应用,近几年自然语言大模型方面呈现跨越式发展的核心逻辑在于规模化效应。简单来说就是,在AI模型里,可以通过不断地增加数据、增加模型大小来实现性能的持续提升。
  就在2月24日,科技部高新技术司司长陈家昌在"深入实施创新驱动发展战略加快建设科技强国"发布会上表示,科技部下一步将把人工智能作为战略性新兴产业,作为新增长强擎,继续给予大力支持。在谈及ChatGPT形成现象级应用时,陈家昌指出,这表现出自然语言模型已具备了面向通用人工智能的一些特征,在众多行业领域有着广泛的应用潜力。
  "ChatGPT科研价值更大"
  自深度学习(Deep Learning)提出十几年来,业界很多人认为规模化效应"到头了",因为随着模型的增大和数据量的增多,模型的收益逐渐递减,即所谓的"边际效应递减"——越增加数据,收益就越来越不明显,性价比就越低。张祥雨指出,这两年,在自然语言处理大模型上却出现了一个不同的现象,即当模型的参数量、训练数据量达到千亿量级时,模型的高级思维能力突然出现了跨越式的增长,这一增长是过去从来没有发现过的。现在大概在千亿量级这个参数"关口",数据和模型量稍微增加一些,模型突然出现了原来不曾有的推理能力,还激发了一些之前往往被认为只有人类才有的能力,如思维链能力。当然,这背后还有诸如代码预训练等许多技术,共同推动了AI的跨越式发展。
  那么,ChatGPT将会对哪些行业产生影响呢?张祥雨表示,以现在ChatGPT它所代表的大模型的发展水平,最被看好的、最先落地的应用可能是智能搜索引擎,此外像各种文字编辑工作,以及各种垂直领域都有落地的潜力。当然在落地过程中可能也会遇到一些问题,比如说如何保证答案的精准程度,如何保证生成的内容是正确的,以及在部署推理的时候要怎么把这个大模型给用起来,真正做到高效并且降低运行成本,这都是落地时需要讨论的。
  "我认为,目前以ChatGPT为代表的AIGC(利用人工智能技术来生成内容),包括它背后的大模型的意义,不仅仅是在落地本身,在我看来它的科研价值可能更大。"张祥雨分析道, 科研价值主要体现在研究人类智能如何产生。从技术角度来看,AI大模型的设计和训练过程并没有专门针对智能做特殊的设计。它的逻辑推理、思维链、reasoning的能力,是研究人员通过大幅增加参数量、增加训练数据量的过程中突然激发出来的,这个现象是非同寻常的。其实这和生物的进化包括人类的进化史也是非常像的。这种突然产生的智能背后不是靠专门的设计,是模型自然而然所形成的。关于这一点到底要如何理解?现在"有智能"的大模型相对于原来"没有智能"的那些模型到底产生了哪些质变?这些都是非常前沿且有趣的课题,值得我们探索。
  与此同时,张祥雨也指出,规模化效应这条路线是否可持续,现在还很难说,需要业界共同去探索。当突破初步的逻辑推理能力瓶颈之后,或许很快会遇到规模化效应如何持续的问题,很可能通过增加数据量获得的收益会再次陷入非常少的状态。此外还要考虑算力的限制,现在大模型已触及算力的上限,如果硬件或者系统架构没有显著变化,模型想再上一个规模化会有很大困难。
  国产AI企业如何做?
  记者注意到,ChatGPT的成本投入引发了业内的关注与讨论。国盛证券研报的测算,ChatGPT仅访问算力和前期训练两项费用初始投入就近10亿美元,单日电费达数万美元,在公有云下,单次训练约为百万至千万美元。因此,如何降低大模型的训练成本,成为摆在AI技术公司面前的一道难题。
  张祥雨称,在过去一年里,其团队针对视觉模型的规模化做了许多努力和尝试,在提升视觉感受、不增加显存消耗方面取得了一些成效。同时也面临许多挑战,尤其是来自视觉和自然语言的差异成为最大的挑战。他认为,如何把视觉模型,尤其是视频这种具有时序性的、信息密度很低但是信息总量很高的数据有效利用起来,然后再设计相关的无监督、自监督的方法,让模型能够从中学到信息,这点非常关键。
  需要指出的是,旷视科技在2022年时就提出的"大"和"统一"是当下视觉AI系统研究的新趋势。张祥雨表示,旷视科技团队在2022年底通过一系列实验和验证,发现视觉模型"统一"的落脚点在于识别类问题和生成类问题的统一。具体来说,生成类的问题比如AIGC是通过生成式的模型产生的;而识别式问题比如传统的分类、检测、分割等,其实从原理上来说既可以用生成类模型来实现,也可以通过判别类模型实现。而为了简单,我们在视觉落地的时候一直用的都是判别式模型。但判别式模型有一个非常大的缺点,当模型很小的时候很好用,一旦需要规模化到很大的量级的时候,会发现它对数据尤其是人工标注的数据要求非常高。此外,它的规模化效应目前已经遇到了上限。这说明生成式模型能更好地利用数据本身的特点,尤其是可以更好地利用无标签标注的数据。
  据张祥雨透露,今年的核心工作重点是要用生成式的模型来实现整个视觉大模型的统一。旷视科技的布局思路是扎根具体的公司主营业务,包括智慧城市、AIoT(物联网)、智慧物流等几大主要场景,从每一个场景出发,先把"从物理世界中来,再到物理世界中去"的这条闭环跑通。只有形成了数据闭环、反馈闭环,模型得到的监督信号才会越来越多,才有条件把这个模型越做越大。所以,"大"和"统一"的趋势是不可阻挡的,是现在解决AI 赋能的主要思路,但要形成更大的规模化就必须要打通全链路,这无论是在商业布局还是在科研方面都必须要坚持的一点,就是要创造条件,想办法为模型做大提供契机。

1972年内蒙发现清朝公主墓,尸身穿龙袍240年不腐,葬品估值过亿1972年,内蒙当地的农民在干农活的过程中发现了一座女性的古墓,专家赶到以后对墓进行了勘察,最终费了九牛二虎之力在主墓穴中发现了一具棺材,而将这具棺材打开以后震惊了在场的所有人。这明朝清官海瑞罢官,买棺材,冒死上疏,直指世宗病根,为啥未被杀明朝清官海端刚正不阿,抑制豪强,打击贪官,安抚平民,为官清廉,百姓爱戴敬重!海瑞去世时,百姓当街跪拜,痛哭失声,如失亲。海瑞幼饱读诗经,多才博学,中举,初任升至知县时,推清丈平赋税16世纪早期,在两大帝国的对抗中,赛利姆一世的安内攘外15世纪末16世纪初,奥斯曼帝国和哈布斯堡王朝的关系发展,主要围绕两位奥斯曼帝国苏丹的对外扩张展开,即为14851512年巴耶济德二世时期和15121520年赛利姆一世时期的殖民扩他预言大清国运800年,为何却被乾隆直接处死?2大原因非杀不可古往今来,有不少精通命理的大师深受统治者所敬重就如武则天在位的时候,袁天罡就非常受到重用,并被老百姓所推崇在看到命理大师平步青云的故事后,历史上也有不少人效仿,想借此一步登天,从此都已经2023年了,还在买128GB的智能手机吗?如果有关注智能手机行业的新机信息,你可能就会知道,最近这段时间有不少厂商都陆续公布了他们的2023(上半)年度旗舰,或是至少也透露新机的相关信息。在这其中,三星GalaxyS23系一天研究一个行业中国基因检测行业市场深度分析原文标题2022年中国基因检测产业链全景图鉴市场成熟化应用加速推进图一基因测序产业链概览1基因测序概况基因测序是基因检测的方法之一,是指通过基因测序设备对生物样本(组织细胞血液样本不同场景下FACEHUB智慧屏的使用价值为什么要选择FACEHUB智能会议平板进行日常会议办公呢,小编总结出了以下六点。1。大多会议室的建设都集中于基础设备,很少有能达到高信息化水平的会议室,传统会议室多采用投影仪白板电台积电3nm再获一大客户?传博通已签订单集微网消息,据业内消息人士透露,博通已向台积电下了3nm芯片订单,与苹果高通联发科英伟达和AMD一起排队等待台积电的N3和N3E工艺制程。据台媒电子时报报道,消息人士称,尽管市场猜柳传快联想杨元庆和百度李彦宏(一)曾经,在我国企业职业经理人里面,我比较佩服联想杨元庆。当然,杨元庆也是通过联想前身公司社招进来的打工者之一。而且,同批进入联想的还有孙宏斌还有分家的神州数码郭为。后来,孙宏斌在工作雷军小米12SUltra全年预计销量已提前卖完去年七月,小米推出了全新旗舰小米12SUltra,售价5999元起。虽然距离小米12SUltra的发布不过半年,但该机目前在小米商城已经断货,仅在部分第三方平台有库存。日前,小米C2022福布斯中国数字经济100强发布,大族激光成功入选近期,福布斯中国和中国电子商会共同发布了2022中国数字经济100强榜单。凭借在数字化转型中带来的积极成效,大族激光成功入选。据了解,该榜单从企业总市值总资产总营业收入和归母净利润
扎克伯格出庭为Meta的VR收购案辩护中国联通发布元宇宙战略行程卡数字藏品来了Meta元宇宙指北播报太长不看版扎克伯格出庭为Meta的VR收购案辩护中国联通发布元宇宙战略,打造从底座到应用的一体化平台首个阅读元宇宙图壤Libraverse正式发布国文聚上线首个元宇宙博物馆索尼便携辽宁方大这个铁憨憨,真的让我有点感动了大家都知道疫情放开以来,退烧药一盒难求。而我竟然发现,东北制药这家药厂,生产的乙酰氨基酚片价格低廉到20粒退烧药只卖2块钱!华佗和张仲景在世也要感动的流泪吧!我已经很久没有见过2块世界杯后国际足联排名巴西世界第一,日本队亚洲第一阿根廷队成为世界杯的冠军,但他们依旧是被未进八强的巴西队力压一头,排名第二,世界杯冠军让阿根廷队积分上涨了64。55分!最近一期的国际足联世界排名第一,巴西队,与上一次排名持平。第日媒日本明年可能迎来涨价潮将有逾7000种食品涨价据共同社22日报道,在日本政府调高2023年度经济增长预期之际,日本帝国数据库公司21日发布的调查结果显示,关于105家上市的主要食品饮料制造商,截至当天已决定在明年1至4月实施涨扎克伯格出庭为Meta的VR收购案辩护中国联通发布元宇宙战略行程卡数字藏品来了Meta元宇宙指北播报扎克伯格出庭为Meta的VR收购案辩护中国联通发布元宇宙战略,打造从底座到应用的一体化平台首个阅读元宇宙图壤Libraverse正式发布国文聚上线首个元宇宙博物馆索尼便携式动作捕捉电动车中的航母,车宽近2米续航达708km,极狐阿尔法安全吗?前段时间问界M7在中保研测试中发生了A柱弯折的问题,让很多人都开始关注电动车的碰撞安全能力。实际上,电动车自打诞生以来,电池安全车身安全就不断被报道,问界M7的成绩似乎成了导火索,泽连斯基即将访美,拜登准备了大礼,最多可提供470亿美元的援助持续的俄乌冲突深刻改变了世界局势,而近日乌克兰总统泽连斯基将访问美国的消息也吸引着世人的目光,泽连斯基此行的顺利与否,似乎关乎着俄乌冲突接下来的发展走向。12月20日,泽连斯基在前花式宠溺!湖大为考研学生送上大礼包,有点卷!寒风凛冽,挑灯苦读距离研究生考试还有4天这些天,湖北大学各学院克服种种困难精心为考研学生准备了小礼物下一站,上岸!数学与统计学学院网络空间安全学院为考研学子准备了一罐心想事成的百事罚球命中率太悲剧马刺萤光头菜鸟突发奇想改用单手罚球本季摆明就是来练兵的马刺队,新秀索汉(JeremySochan)在开季初期受到不少注目,除了常常让人眼睛一亮的髮色之外,场均7。3分4。0篮板2。2助攻的数据算是可圈可点,不过他目刘邦布衣提三尺剑取天下(2)一斩蛇而起刘邦起兵,是典型的随大流,也可以讲是顺势而为。刘邦处的年代是秦朝末年,社会形势有以下几个特点一是秦虽统一天下,但时间不长,其他国家的士大夫后代还在蠢蠢欲动着复国,一句话,为什么韩信请封齐王时,张良和陈平要踩刘邦的脚?读西汉(40)松鼠父子读西汉系列故事(40)韩信封齐王文松鼠爸爸韩信汉王,韩将军派我前来,有一个请求能否封他为假齐王?汉四年(前203年)的某一天,韩信在连续灭降魏代赵燕齐五国后,派使向刘邦要名