范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

因果推理效果比肩ChatGPT,封神榜推出燃灯模型

  机器之心专栏
  编机器之心编辑部
  最近,AIGC 行业的火爆得益于人工智能 (AI) 技术的快速发展,元宇宙数字人、游戏 NPC、复杂场景的控制和决策等越来越多的应用对模型认知能力的强烈需求日益凸显。以预训练大模型为基座,着力于探究语言模型的认知能力是 IDEA 研究院认知计算与自然语言研究中心(IDEA-CCNL)"盖亚计划"的重要方向。
  "盖亚计划"由 IDEA 研究院认知计算与自然语言研究中心发起,致力于在预训练大模型时代建设 AIGC 的基础设施。
  为赋能中文 AIGC 行业,IDEA-CCNL 封神榜团队宣布公开最新的研究成果,开放首个因果推理生成 API,并开源对应 50 亿参数模型—燃灯,包括演绎推理生成(Randeng-Deduction)与反绎推理生成(Randeng-Abduction), 在部分推理生成任务上其效果甚至可以超过 ChatGPT。以自然语言作为思考推理和输出的媒介,模型凭借其强大的语言能力在中文因果语料上学习,逐步具备常识知识以及更高层次的推理能力,如演绎推理、反绎推理、反事实推理、隐含知识挖掘等。在具备了因果推理能力的基础上,模型能够模仿人类思考过程,实现语言层面的自动多步推理,展示出其巨大的潜在应用价值,帮助拓展了人类的认知边界。
  目前,因果推理生成 API 及在线体验 demo 已经开放,对应模型已经开源至 Huggingface 平台: 燃灯演绎推理(Randeng-Deduction) API:https://api.fengshenbang-lm.com/v1/deductiveReasoning 模型:IDEA-CCNL/Randeng-TransformerXL-5B-Deduction-Chinese 燃灯反绎推理(Randeng-Abduction) API:https://api.fengshenbang-lm.com/v1/abductiveReasoning 模型:IDEA-CCNL/Randeng-TransformerXL-5B-Abduction-Chinese 在线 demo 体验 https://ccnl.fengshenbang-lm.com/single/reasoning/
  下面将从多个维度来阐述如何使用燃灯因果推理模型,燃灯能做到什么程度和效果以及在每个维度上和 ChatGPT 的对比,帮助大家深入了解。
  基础推理能力:多步推理
  基于 Randeng-Deduction 模型,可以进行多步因果推理。给定具体的一个事实推理前提条件(如下图 1 所示的根节点),Randeng-Deduction 模型能够以自然语言的形式迭代地产生该事件可能导致的结果与影响,最终形成庞大的因果推理树。
  图 1 多步因果推理树
  而 ChatGPT 基于 "债券市场收益率快速下滑" 这一事实给出了单链多步推理的结果,推理过程存在一点和前提事实矛盾的地方— 由 "债券市场收益率快速下滑" 推理出了"债券收益率上升"。(如下图 2)
  图 2 ChatGPT 的多步因果推理结果
  基础推理能力:演绎 + 反绎推理
  将 Randeng-Deduction 模型与 Randeng-Abduction 模型结合,能够同时进行演绎和反绎多步推理,让模型分析导致事件发生的一系列原因(图 3 左)以及该事件产生的结果(图 3 右),赋予了语言模型思考因果关系的能力。
  图 3 反绎推理树 (左) 和因果推理树(右)
  ChatGPT 的单步反绎推理也能够给出导致 "玉米价格持续上涨" 的多方面因素,在这个维度上达到的效果比较一致。
  图 4 ChatGPT 的反绎推理结果
  基础推理能力:三段论和反事实推理
  Randeng-Deduction 模型具备丰富的常识知识,但其强大的推理生成能力并非依赖于对于知识的记忆。采用三段论的形式,Randeng-Deduction 模型既能在正确的事实上进行演绎推理(图 5 上支、图 6 上支),同时也能运用常识知识进行反事实推理(图 5 下支、图 6 下支)。
  图 5 三段论和反事实推理①
  图 6 三段论和反事实推理②
  而对应于图 6 的输入,ChatGPT 未能正确地进行反事实推理,且混淆了变温动物和恒温动物的定义。
  图 7 ChatGPT 的反事实推理结果结果
  高级推理能力:问题制导下的自动推理
  利用 Randeng-Deduction 模型的推理能力,加上蒙特卡洛树搜索(MCTS)算法,可以实现问题制导下的自动推理。图 8 展示了在给定问题后,基于前提事实推出的因果链条。
  图 8 问题制导下的自动推理(仅展示 MCTS 中概率最大的单条路径)
  通过调整提示(prompt)输入,ChatGPT 也同样能够针对前提事实,给出回答目标问题的推理链条。在这个任务上虽然 Randeng- Deduction 和 ChatGPT 给出的推理链条思考角度不同,但都成功地回答了目标问题。
  图 9 ChatGPT 针对提问进行多步因果推理的结果
  高级推理能力:无限推理
  借助于 Randeng-Deduction 模型强大的因果推理生成能力,构建自动推理系统,让机器无休止地自主思考和推理。但受限于资源及缺乏对应结果评估和选择模型,ChatGPT 目前还无法做到无限推理。
  图 10 "永不停止"的自动因果推理(仅展示部分推理结果,未展示连接关系)
  背后的训练技术揭秘
  Randeng-Deduction 模型与 Randeng-Abduction 模型采用自回归的方式,将因果命题的生成抽象为给定前提命题的条件生成任务。我们选用 50 亿参数量的 Transformer-XL 作为基础模型,预先在开放域中文因果语料上进行了自回归因果生成任务的训练,使其具备了一定的因果生成能力。为了让模型突破训练数据的局限,强化其因果推理的能力,让模型并非单纯 "回忆" 训练数据,我们尝试引入了 3.3 亿参数量的 RoBERTa 模型作为因果关系判别模型,结合两个因果生成模型开展了自洽(Self-consistent)闭环迭代训练。在闭环中,生成模型凭借各自的因果生成能力为闭环系统提供了源源不断的伪样本,判别模型从多样的伪样本中筛选供自身以及生成模型训练的样本。在闭环运转的过程中,三个模型逐渐从不同的角度(演绎生成、反绎生成、因果关系判断)对因果推理达成一致,得到持续的提升。
  图 11 训练过程总览
  未来的场景应用
  基于强大的因果推理能力,燃灯模型未来落地可以更多聚焦于大量的"推理场景",比如辅助研究分析报告撰写、赋能剧本杀的剧本快速设计、帮助作家创作出更多"细思极恐" 的推理情节等等,甚至能够作为智能机器人和虚拟人的底层逻辑驱动链条,具备更强的认知和决策能力,使之具备像人类一样的思考能力。
  燃灯因果推理模型是 IDEA 研究院 CCNL 中心继开源中文 Stable Diffusion 太乙模型之后向 中文 AIGC 复兴以及机器认知计算边缘探索迈出的第二步,也是"盖亚计划" 发出的第二架马车。后续还将有更多的模型能力推出,敬请期待。
  封神榜相关链接
  封神榜官网:https://fengshenbang-lm.com
  封神榜 github 主页:GitHub - IDEA-CCNL/Fengshenbang-LM
  封神榜 huggingface 地址:IDEA-CCNL (Fengshenbang-LM)
  封神榜 doc: https://fengshenbang-doc.readthedocs.io/zh/latest

校园贷鼻祖走进直播间,屡创屡败的罗敏开始卖菜,能搞成吗?7月17日,趣店罗老板的直播间以9000万观看人次刷爆了抖音,在其主页的个人介绍中,罗老板称自己正在二次创业预制菜。然而事实上,他和他的趣店早就第一粗尝试向不同领域转型,几度站在创四川一餐厅发现恐龙化石85岁谢贤斩获金像奖据外媒报道,7月16日,小米公司在意大利被处以320万欧元(约2176万元人民币)的罚款。做出这一处罚的是意大利竞争管理局。该机构表示,在保修范围内的产品出现划痕或其他轻微缺陷时,福建养老金调整方案公布,两降两不变,算算你能涨多少?点击上方蓝色按钮,即可收听全文福建养老金调整方案公布,两降两不变,算算你能涨多少?福建是我国经济发展较好的省份,GDP排名靠前。第七次全国人口普查结果显示,福建全省常住人口为41511换1交易方案!愿为杜兰特付出所有筹码,联盟最强三巨头诞生一支冲冠级别的球队,拥有一名超级巨星非常重要。像上赛季太阳队战绩全联盟第一,结果倒在了西部第二轮季后赛,保罗艾顿布克的三巨头阵容,缺少一名超级巨星,他们三巨头打不过东契奇一个年轻的黑龙江养老金调整方案印发,一升两降一不变,算算你能涨多少?点击上方蓝色按钮,即可收听全文黑龙江被誉为北国粮仓。第七次全国人口普查结果显示,黑龙江全省常住人口为31850088人,60岁及以上人口7395690人,占23。22,高于全国平均广东省养老金调整方案公布,整体有涨有降,附实例对比分析千呼万唤始出来!7月18日,700多万名广东省退休人员喜迎今年养老金调整方案,大家都非常激动,迫不及待地想要测算自己能涨多少钱。确实,今年已经是职工养老金的第18次连涨了,每年大家国家队男篮亚洲杯12进8比赛50分淘汰印尼!裁判却成为最大的争议7月18日6点30分,国家队男篮以小组赛第二的身份在12进8的淘汰赛中狭路相逢东道主印尼队!印尼队并不是一个强队,我们和印尼队上一次交手时还是在2007年的8月1日,当时我们国家队西方国家掀起罢工狂潮,美媒西方病了最近美国国内各种罢工游行,英法德国内也在罢工内讧,连美国媒体都掩饰不下去了,称西方这次生病了。前不久这些国家还在做着让俄罗斯二次解体的梦,现在他们自己已经快被折腾散架了,最典型的就宝莲灯,每股净资产7。2元,累计跌幅达三杆通底,反弹在即,每股净资产7。2元,股价只剩3。87元。累计跌幅达88。33,从39元跌到3。85元。低位出现宝莲灯技术形态,宝莲灯进可攻,退可守,是典型的变盘特征。核心概念M广西北海涠洲岛紧急通告暂停所有人员进出涠洲岛广西北海涠洲岛旅游区新冠肺炎疫情防控指挥部17日发布通告,为进一步减少人员流动,降低交叉感染风险,遏制疫情传播蔓延,切实保障人民群众生命安全和身体健康,涠洲岛旅游区严格执行北海市分顶风作案野心炸裂,亲日辱华,赵薇啊赵薇也该为疯狂买单了顶风作案野心炸裂,亲日辱华,赵薇啊赵薇也该为疯狂买单了她一次又一次地走进观众的视野,但我的印象是赵薇在还珠格格中扮演的小燕子角色。赵薇这个形象红遍了大江南北,受到了人们的喜爱,甚至
万豪国际集团高层调动,毛怡冰为新任大中华区总裁文旅快报记者史春蕾编辑严之俊2023年2月25日,万豪国际集团宣布,毛怡冰被任命为万豪国际集团大中华区总裁,将常驻上海办公室,并向集团总裁兼首席执行官AnthonyCapuano汇报。我很Meta连夜加入AI大模型混战!用110参数量干过GPT3,单个GPU就能跑智东西(公众号zhidxcom)编译程茜编辑心缘智东西2月25日报道,围绕生成式AI的前沿技术竞争愈发胶着。就在昨晚,Meta突然公布了一款全新的AI大型语言模型LLaMA,宣称可美乌会面惊现泽连斯基替身,俄继续往欧盟送气,北约援乌弹药告急众所周知,乌克兰总统泽连斯基素来喜欢以硬汉形象出现在媒体面前,来表明他的勇敢。然而最近他的勇敢似乎打了一些折扣,根据吃瓜的波兰事实报报道,最近近日会见拜登的泽连斯基很有可能只是本尊哈萨克斯坦教育部使用国语教学的幼儿园数量不断增长哈萨克斯坦民间对使用哈萨克语教学的学前教育机构,以及哈萨克语的学前教育课程的需求度正在不断提高。哈萨克斯坦教育部儿童早期发展研究所所长马娜拉阿达莫娃表示,截至目前,哈萨克斯坦共拥有科创板指数一季度调样3月10日生效,这些股票有变动科创50科创信息科创生物科创芯片科创高装科创材料等指数样本将获调整,于2023年3月10日收市后生效。2月24日,上海证券交易所(下称上交所)公布了科创50等科创板指数一季度定期调2022年全球电视销量排行榜TCL超越LG成世界第二,海信无缘前三在2022这个非同寻常的年份,全球消费市场有所减退,整个电视行业都经受了不小的考验。但值得高兴的是,中国电视企业成功将考验化为机遇,TCL海信创维长虹等国产电视龙头企业在2022年通信赋能,卖花渔村的这个春天更美了来源人民网安徽频道卖花渔村,位于安徽歙县新安江上游的南岸沟谷腹地,一座隐藏在徽州深山里的古村落。因为村落的整体形态像条鱼,加上村民大多靠卖花卉谋生,故称为卖花渔村。每年2月,山间梅流感神药奥司他韦多地断货!有公司曾创造60亿销售神话流感神药奥司他韦多地断货!有公司曾创造60亿销售神话,已降价至1元片2月26日,红星资本局从电商及线下药店获悉,抗流感药物奥托他韦迎来销售高峰,甚至出现断货。身为奥司他韦行业龙头,元宇宙里办业务,机器人跳鬼步舞香港传媒高层人士大湾区参访团走进广深莞戴上VR眼镜,在元宇宙政务大厅里体验便捷政务服务走在广州的弥敦道,看港澳青年创业者在会议室里头脑风暴站在河套深港科技创新合作区远眺一河之隔的香港在松山湖国际机器人基地看产学研结合孵田鹏飞5比0横扫奥沙利文,携手庞俊旭晋级四强文羊城晚报全媒体记者苏荇2023年斯诺克威尔士公开赛八强战18日战罢,中国选手田鹏飞击败奥沙利文,庞俊旭淘汰乔奥康纳,双双挺进四强,这也是两人职业生涯的第一个排名赛四强。田鹏飞中国反转!法国2巨星堕落,才29岁就混日子,世界杯夺冠花光所有运气近日,意甲劲旅莱切官方宣布,球队中卫乌姆蒂蒂受伤了,他的右大腿肌肉轻微挛缩。莱切方面并没有透露乌姆蒂蒂的伤缺情况,但是我们可以确定的是,乌姆蒂蒂现在就是纯粹的玻璃人,伤病一直在影响