范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

算法自动划重点AI学会抱佛脚

  预训练模型的兴起给自然语言处理(NLP)带来了"新面貌"。
  近年来,Google、Facebook、OpenAI、微软、百度等人工智能"头部玩家"推出多个颇具影响的预训练模型,并反复迭代出十多个版本。无论学术界还是业界,人们对大规模预训练模型"热情高涨"。
  日前,来自清华大学的一支研究团队提出一种简单高效的NLP学习框架。不同于当下NLP社区主流的"大规模预训练+下游任务微调"的范式,这一框架无需进行大规模预训练,同时将训练效率提升两个数量级,并在多个NLP任务上,实现了比肩甚至超出预训练模型的性能。近日,相关研究以预印本形式,在arXiv上发表。
  预训练模型的"内功"
  预训练模型在自然语言处理领域蓬勃发展,近年来在多个子方向取得了颠覆性的成果。
  "自然语言处理的‘预训练’过程,就像武侠小说中,练武之人的‘修炼内功’。"上海对外经贸大学副研究员邵浩说,"一个人要成为武林高手,需要有扎实的"内功",内功修炼好之后,再去学各种招式就非常容易上手,并能发挥其最大效用。"
  随着深度学习的发展,模型参数显著增长,从而需要越来越大的数据集,用于充分训练模型参数。然而,因大部分NLP任务的标注成本极为高昂,尤其是句法和语义相关的任务,构建大规模标注数据集尤为困难。
  相比较而言,大规模无标注数据集相对易于构建。为更好地利用海量无标签文本数据,常规的做法是首先从这些数据中学到较好的文本表示,然后再将其用于其他任务。许多研究表明,在大规模无标注语料中训练的预训练语言模型,可以使多方面NLP任务获得显著的性能提升。
  通过海量无标注语料来预训练神经网络模型,可以让人工智能更利于下游NLP任务的完成。预训练模型的作者已经设计出了基准模型,这样,使用者就可以在自己的NLP数据集上应用该模型,而无需从头开始构建模型来解决类似的问题。尽管后续过程需要进行一些微调,但这为人们节省了大量的时间和计算资源。
  2018年,无监督的双向预训练语言模型ELMo被提出,这种上下文相关的文本表示方法在多个典型任务上表现惊艳,能有效处理一词多义问题。紧随其后,GPT,BERT等预训练语言模型相继被提出,预训练模型技术开始在NLP领域大放异彩,并在各种下游任务中遍地开花。
  任务驱动模型出场
  "预训练语言模型因其强大的性能被广泛关注,基于‘预训练—微调’的范式也成为许多NLP任务的标准方法。"清华大学交叉信息研究院助理教授、RecurrentAI联合创始人杨植麟对《中国科学报》说,"然而,当前通用语言模型的预训练成本极其高昂,这使得只有少数资源充足的研究机构或组织能够对其展开探索。"
  为解决上述问题,杨植麟团队提出的一种完全不需要预训练语言模型的高效学习框架。这一框架从通用语料中筛选出与下游任务相关的子集,并将语言建模任务与下游任务进行联合训练。
  该论文第一作者、清华大学计算机科学实验班(姚班)大四本科生姚星丞介绍说,提出任务驱动的语言模型的想法源于一个基本的观察:人类可以通过对关键信息的学习,在有限的时间和精力投入情况下,快速掌握某一任务技能。例如,在临近考试时,学生仅根据考纲复习浏览若干相关章节的要点即可应对考试,而不必学习所有可能的知识点。与之类似,预训练语言模型在某一下游任务上的优良表现,"很有可能因为来自于语料中与下游任务相关的数据"。
  基于这一判断,该团队提出任务驱动的语言模型(TLM),它仅利用从大规模通用语料中提取的少量与下游任务相关的数据,就可以取得与全量数据类似的结果。
  "相较于传统的预训练模型RoBERTa(基于BERT的改进模型,使用更大的批次和更多的数据对模型进行更长的训练),TLM仅需要约1%的训练时间与1%的语料,即可在众多NLP任务上,表现出比肩甚至超出预训练模型的性能。"姚星丞说,"我们目前也正在尝试将任务驱动的方法推广到更大规模的模型上,如GPT-3或T5。"
  跳出预训练范式
  为了从大规模通用语料中抽取关键数据,TLM以任务数据作为查询对象,用基于稀疏特征的BM25算法作为召回算法,对通用语料库进行相似数据的召回。
  "除已有的下游任务数据以外,其余的语料均通过BM25算法进行相似性匹配而自动筛选,不需要人工做额外的选择与标记。"姚星丞说。"TLM基于任务数据和召回数据,同时优化任务目标和语言建模目标,从零开始进行联合训练。"
  为了测试TLM的性能,研究人员在8项NLP分类任务上,从三个不同规模展开了对比实验。这8项任务涵盖了计算机科学、生物医药、新闻、评论等4个领域,包括了训练样本数量小于5000的低资源任务和训练样本数量大于20000的高资源任务,任务类型覆盖了话题分类,情感分类,实体关系抽取等。
  测试结果显示,和对应"预训练—微调"基准相比,TLM实现了相当甚至更优的性能。平均而言,TLM减少了两个数量级规模的训练计算量以及训练语料的规模。整体来说,预训练模型以极高的成本学习尽可能多的,和任务无关的知识,而TLM以非常低的成本,针对每个任务学习相关知识。
  "当我们有少数特定目标的任务需要解决的时候(例如希望对少量几个数据集进行研究),TLM会是非常高效的。"姚星丞说,"而需要一次性解决大量任务时(例如工业界构建一个NLP平台为多方提供相似的服务),预训练模型仍然具有优势。"
  此外,TLM是任务驱动的,所以可以给研究人员更大的自由度,从而自定义策略进行标记、序列长度、数据表示、超参数的调整等等,从而达到提高性能和效率的目的。
  "TLM的提出,让NLP研究跳脱出‘预训练—微调’范式成为可能,这有利于推动NLP研究公平化。"杨植麟解释说,预训练本身严重依赖大量的计算资源,这一限制使大多数NLP研究者只能专注于对微调算法的研究。然而微调算法的性能上限,很大程度上受预训练模型性能的约束。而TLM可以让大多数研究人员可以以较低的代价和较高的效率,基于最先进的解决方案对模型架构、损失函数、算法等方面进一步自由探索。
  杨植麟认为,未来会有更多有趣的研究可以在TLM的基础上展开。例如,如何经济地达到更大规模预训练模型的表现效果;如何提升TLM的通用性与可迁移性;可否利用TLM进行小样本或零样本学习等。此外,还可以将预训练模型和TLM结合,从而在通用性和效率之间实现更好的权衡。(张双虎)
  相关论文信息:https://arxiv.org/pdf/2111.04130.pdf
  项目地址:https://github.com/yaoxingcheng/TLM

高端手机不买小米,低端不买华为荣耀,现如今这句话还适用吗?低端不买华为和荣耀倒是继续适应,华为那么因为受到了制裁,目前主要还是保留高端的Mate系列和P系列产品线,中低端的Nova,畅享和麦芒基本上属于放养状态了,中端的Nova虽然还有新微信可能会消失,但社交会演进到下个出行时代(上)图片来源视觉中国文丨SmarterMonkey,作者丨小石猴互联网问世后的每一个阶段,从本地到移动,社交都是催化市场的重头戏。如今平均每天3。7小时的人均移动设备社交媒体使用时间,李子柒不搞直播带货,收入来源从哪里来?年收入1。6亿的李子柒根本不需要开直播带货,她用5年时间把自己打造成为国际网红,全网拥有超过1亿的粉丝量,当之无愧的第一网红。从月入300元到年收入1。6亿李子柒的走红绝不仅仅是偶开一家手机店大概需要多少资金?长话短说,有些朋友对于开手机店很感兴趣,但是苦于不了解这个行业。我自我感觉对这方面还算比较了解,想就这方面给感兴趣的朋友分享点经验大致,你得从以下几个方面入手1市场调查,包括周围人为什么好像一夜之间,白色面板手机都消失了?作为一个典型的选择困难症患者来说,黑白灰三色永远是我们在购物时最简单无脑的选择,因为挑东西真的很烦。这三种颜色就能够很直接的帮我解决了很多选择时的困扰,而这三种颜色在我购买手机时候国外版本的抖音tiktok怎么使用?首先你要会下载和安装TikTok,抖音国际版。要想在国内使用的话,建议用TikTokSIM卡,因为tiktok屏蔽了国内的SIM卡,用tiktoksim(北美的卡)直接连接wifi五菱宏光MINI真的会出燃油版本吗?五菱一直是汽车圈话题的引爆者,特别是五菱宏光MINIEV的出现,销量更是逐渐地攀升。而且之前还超越了特斯拉成为了国内新能源的月度销冠车型。今年还推出了更可爱的马卡龙版本,颜色的搭配一块自研芯片,揭开vivo持续创新面纱胡柏山把车停好后,看了下时间932分。从东莞走沿江高速到深圳宝安的采访会场,一路通畅,比约定的时间早到了28分钟。作为vivo执行副总裁兼首席运营官,胡柏山上次接受媒体采访还是在2坐地起价!苹果13取消256G版本,要加2000块才能买到更大的内存随着iphone13发布时间的愈发临近,有关新款苹果手机的各种消息也是层出不穷。而其中,有一条爆料吸引了小编的注意,也让各大果粉侧目。有一位科技博主在网上分享了新一代苹果手机的参数VERTU手机高价回收威图手机旧机置换平常经常见到回收黄金手表奢侈品包包,很少见有回收手机的,但VERTU手机总裁签名系列售价都是10W以上,很多用户置换新款后就搁置起来了,那么昂贵的VERTU威图手机可以回收吗?VE魅族19重拳出击,18G运存78W快充,4K无挖孔直屏极其亮眼魅族和小米华为几乎是同时出道的,但如今三大厂商的局面却大不相同。小米成了三者之中市场份额占比最高的,小米凭借着性价比打败了不少同行竞争者,同时也赶超了华为。而华为其实是实力最强的,
旗舰机和普通机的区别机在哪,难道好手机非要买旗舰机吗?现在人们想买好一点手机,都会去旗舰机中挑选,可是旗舰机太贵了。难道没有既便宜配置又好的普通机了吗?旗舰机和普通机的区别在哪?旗舰机和普通机的区别其实旗舰机代表的是这个品牌的最高配置上市不到三年,反超华为升到全球第六,成国产手机最大黑马声明原创不易,禁止搬运,违者必究!虽然说手机市场的竞争力异常激烈,但是这并不意味着后来者就没有入围的机会。不难发现,在手机市场诞生了一些新面孔,他们以极短的时间,占领了不少的市场份小米推出第二代最新智能晾衣架产品,配置升级还带两种烘干设计前言晾衣杆这种物品基本每家都有,传统的是固定在阳台墙壁上,晾晒衣服的时候用撑衣杆将衣物挂上去,后面又出了一种可以升降的,不过设计的较为简单,是那种手动摇杆升降设计,这些我都使用过,数字货币悟空今日分析Btc又这样玩,插针一下上去了,这有点对45000发起冲击的意思了,支撑42000,整体还是震荡看涨多一些Eth继续联动Ftm是真强势,那天的抛压吃完了又继续拉,强支撑2。9,3上创新,以国家需求为己任来源人民网人民日报习近平总书记指出,要强化国家战略科技力量,提升国家创新体系整体效能。国家实验室国家科研机构高水平研究型大学科技领军企业都是国家战略科技力量的重要组成。各个主体互为魅蓝10正式发布,定位老年机,售价699元,你怎么看?魅族手机有着比较长的发展史,在国内一直都有很高的知名度,自魅族成立以来,魅族手机就收获了许多粉丝,其独特的理念,加之其性能以及制造工艺都比较先进,更是占领了大部分国内手机市场,同时小米MIX5渲染图圆形副屏星环相机!配备无孔屏售价或过6000元在去年小米MIX4的发布会上,雷军表示MIX版本每年都会更新,所以今年米粉们可以期待下小米MIX5,而就在近日,网上已经曝光了小米MIX5的渲染图,相比小米以往发布的旗舰手机,这款OppoA96轻薄直角机身双子星环呼吸灯售价1999元1月15日,OPPOA96将全渠道正式开售,售价1999元。全系直角中框设计配合全新一代流光晶钻工艺和新配色,搭载高通骁龙695处理器,与8GB256GB的存储组合,以及4800万LG新能源签下70万吨干锂精矿采购订单,可生产约250万辆电动汽车所需电池据国外媒体报道,随着电动汽车需求的大幅提升,对动力电池的需求也逐年增加,各大电池制造商也在尽力提高产能,以满足强劲的市场需求,获得更多的市场份额。各大电池制造商提高产能获得更多的市补贴退坡30新能源汽车要涨价了?2022年1月1日,在国内各大新能源车企纷纷发布2021年全年销量的同时,财政部等四部门联合发布了关于2022年新能源汽车推广应用财政补贴政策的通知,根据其内容,明确了新能源汽车每水皮双碳目标下光伏锂电新能源汽车三大赛道已形成随着双碳概念的提出,中国经济正在转型升级,光伏新能源车锂电池三大赛道已经明确。这将是一个长期的发展方向,虽然过程会一波三折,但肯定会是风口。在二级市场上,过去两年新能源股行情大好。