范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

预训练周刊第33期预训练语言模型的高效分层域适应

  关于周刊
  本期周刊,我们选择了9篇预训练相关的论文,涉及词汇迁移、常识问答、多模态训练、层次训练、对比学习、图像分割、图文模型、蛋白质作用和免疫特征表示的探索。此外,在研究动态方面,我们选择了2篇预训练资讯,将介绍大模型竞争和视觉算法年度回顾方面的一些最新内容。最后,在资源推荐方面,我们选择了1篇预训练资源,将介绍跨语言摘要方面的一些最新内容。
  本期贡献者:申德周 翟珂 吴新刚
  论文推荐
  标题:俄罗斯Yandex、Facebook等 | Fine-Tuning Transformers: Vocabulary Transfer(微调Transformer:词汇迁移)
  简介:本文讨论了巨大型预训练模型为下游任务微调而引发迁移学习的探索之一:词汇迁移。自然语言处理领域最新进展中Transformer已成为绝对主流。这些模型的大多数实际自然语言处理应用通常是通过迁移学习实现的。本文研究了用于微调的语料库特定标记化是否会提高模型的最终性能。作者通过一系列的词汇表优化和迁移实验,证明了这种词汇表优化和迁移策略可以提高模型的性能。作者称之为:在迁移学习领域开创了词汇迁移的这一方向。
  论文地址:「链接」
  标题:加州大学 | Zero-shot Commonsense Question Answering with Cloze Translation and Consistency Optimization(基于完形转换和一致性优化的小样本常识问答)
  简介:本文在常识问答(CQA)方向研究预训练语言模型中的知识提取。作者将重点放在更好地利用预训练语言模型中存储的知识。虽然研究人员发现,通过让预先训练的语言模型填充精心设计的关系提取和文本分类提示的空白,可以提取嵌入在预训练的语言模型中的知识,但目前尚不清楚作者是否可以在CQA中采用这种范式,其中输入和输出的形式更加灵活。为此,作者研究了四种可以将自然问题翻译成完形填空式句子的翻译方法,以更好地从语言模型中获取常识性知识,包括基于句法的模型、无监督神经模型和两种监督神经模型。此外,为结合不同的翻译方法,作者提议鼓励使用未标记数据对不同翻译问题进行模型一致性的预测。实验证明了作者的方法在三个CQA数据集上的有效性。
  论文地址:「链接」
  标题:威斯康星大学、微软等 | RegionCLIP: Region-based Language-Image Pretraining(基于区域的语言图像预训练)
  简介:本文研究了基于识别图像区域的语言图像预训练模型。业界使用"图像-文本对"的对比语言图像预训练 (CLIP)在零样本和迁移学习中的图像分类方面取得了令人印象深刻的结果。然而,作者表明直接应用此类模型来识别图像区域以进行对象检测会导致性能不佳,因为存在域偏移:CLIP 被训练以将图像作为一个整体与文本描述进行匹配,而没有捕获图像之间的细粒度对齐区域和文本跨度。为了缓解这个问题,作者提出了一种称为 RegionCLIP 的新方法,该方法显着扩展了 CLIP 以学习区域级视觉表示,从而实现图像区域和文本概念之间的细粒度对齐。作者的方法利用 CLIP 模型将图像区域与模板标题匹配,然后预训练作者的模型以在特征空间中对齐这些区域-文本对。当将作者的预训练模型转移到开放词汇对象检测任务时,作者的方法在 COCO 和 LVIS 数据集上的新类别分别显著优于现有技术 3.8 AP50 和 2.2 AP。
  论文地址:「链接」
  代码地址:https://github.com/microsoft/RegionCLIP
  标题:艾伦AI研究所、慕尼黑大学 | Efficient Hierarchical Domain Adaptation for Pretrained Language Models(预训练语言模型的高效分层域适应)
  简介:本文研究了以分层树结构的域表示实现预训练语言模型的分层。生成式的语言模型,在不同的通用领域语料库上进行训练,然而这就限制了它们对更窄领域的适用性,之前的工作表明,持续的领域内训练可以提供进一步的收益。在本文中,作者介绍了一种使用计算效率高的适配器方法将域适应扩展到许多不同域的方法。作者的方法基于对文本域部分重叠的观察,作者将域表示为分层树结构,其中树中的每个节点都与一组适配器权重相关联。当与冻结的预训练语言模型相结合时,这种方法可以实现相关领域之间的参数共享,同时避免不相关领域之间的负面干扰。该方法很高效:对于 D 个域,计算成本为 O(log(D))。GPT-2 的实验结果和 C4 中 100 个最具代表性的网站中的大部分显示了域内的全面改进。作者还为保留域提供了一种推理时间算法,并表明对通过树的多条路径进行平均可以进一步提高泛化效果,同时仅增加推理的边际成本。
  论文地址:「链接」
  标题:谷歌、亚马逊等 | Supervised Graph Contrastive Pretraining for Text Classification(用于文本分类的有监督图对比预训练)
  简介:本文介绍了用于文本分类的对比预训练技术。但是,通常可以使用来自与当前任务共享标签语义的相关任务的标记数据。作者假设有效地使用这些标记数据可以更好地概括当前任务。在本文中,作者提出了一种通过基于图的监督对比学习方法有效利用来自相关任务的标记数据的新方法。作者通过将监督信息从示例外推到令牌来制定令牌图。作者的公式产生了一个嵌入空间,其中属于同一类的高/低概率标记彼此靠近/远离。作者还提出了详细的理论见解、以作为本研究方法的驱动。基于作者采用的数据集,实验表明:作者的方法优于预训练方案 2.5 % 、并且基于示例级对比学习的公式提升约 1.8 %。此外,在零样本场景中实验表明跨域有效性平均提升3.91%。最后,作者还证明了该方法可以用作知识蒸馏设置中的噪声教师模型、约平均提升4.57% 。
  论文地址:「链接」
  标题:百度 | ERNIE-ViLG: Unified Generative Pre-training for Bidirectional Vision-Language Generation(ERNIE-ViLG:双向视觉语言生成的统一生成式预训练)
  简介:视觉语言预训练模型极大地提高了图像-文本生成任务的性能,但用于文本-图像生成任务的大规模预训练模型仍在研究中。本文提出了ERNIE-ViLG,一个统一的生成式预训练框架,基于Transformer模型并将图像生成和文本生成都表述为以文本/图像输入为条件的自回归生成任务。双向的图像-文本生成模型简化了跨视觉和语言的语义对接。对于文本到图像的生成过程,作者进一步提出了一种端到端的训练方法来共同学习视觉序列生成器和图像重建器。为了探索双向文本-图像生成的大规模预训练的前景,本文在1.45亿图像-中文文本对的大规模数据集上训练了一个100亿参数的模型,该模型在文本-图像和图像-文本任务上都取得了最先进的性能。
  论文地址:「链接」
  标题:华中科大、西安交大、微软 | A Simple Baseline for Zero-shot Semantic Segmentation with Pre-trained Vision-language Model(用预训练视觉语言模型进行零样本语义分割的基线)
  简介:通过视觉语言预训练的零样本图像分类已经渐趋成熟,然而在更广泛的视觉问题上如物体检测和语义分割还需研究。本文在预训练的视觉语言模型CLIP上构建零样本语义分割基线。该问题难点在于语义分割和CLIP模型在不同的视觉颗粒度上执行,语义分割在像素上处理,而CLIP在图像上执行。为了弥补处理粒度上的差异,本文没有使用普遍的基于FCN的单阶段框架,而使用一个两阶段的语义分割框架,第一阶段提取泛化掩码,第二阶段利用基于图像的CLIP模型,对第一阶段产生的掩码图像作物进行零样本分类。本文的实验结果表明,这个简单的框架在很大程度上超过了目前的先进技术。凭借其简单性和强大的性能,本文希望这个框架能够作为基线以助未来的研究。
  论文地址:「链接」
  标题:中山大学 | AlphaFold2-aware protein-DNA binding site prediction using graph transformer(使用图Transformer进行结合AlphaFold2的蛋白质-DNA结合位点预测)
  简介:蛋白质与DNA的相互作用在生物系统中起着至关重要的作用,确定蛋白质与DNA的结合位点是对各种生物活动,如转录和修复,进行机理理解和设计新型药物的第一步。现有的基于序列的方法只考虑了顺序相邻的上下文特征,这对捕捉空间信息是有限的。对此本文提出GraphSite,作者将结合位点预测问题转化为图节点分类任务,并采用基于Transformer的预训练模型,通过AlphaFold2预测结构,将蛋白质结构信息、AlphaFold2中Evoformer的表征和序列进化信息考虑在内实现DNA结合残基的识别。GraphSite大大改善了基于序列和结构的最新方法,并且在181种蛋白质的独立测试集上得到进一步证实,在AUPR和MCC上分别超过了最先进的基于结构的方法16.4%和11.2%。
  论文地址:「链接」
  标题:耶鲁 | Pipeline for retrieval of COVID-19 immune signatures(检索COVID-19免疫特征的流程)
  简介:随着生物医学文献出版速度的加快,检索其中的特定的科学信息变得更有意义。在新冠流行的大背景下,有效地检索病毒免疫特征,即生物标志物,可以帮助了解不同的SARS-CoV-2感染的免疫反应机制。对此,本文构建了一个系统的流程来识别和提取结构化的COVID-19免疫特征。具体而言,作者使用基于SPECTER预训练的生物文本嵌入,配合SVM分类器来自动识别含有免疫特征的论文,并进一步对这些论文进行半自动查询流程构建,检索特征信息。此外,基于预训练嵌入的流程也可确定免疫特征的类型,比如基因表达与其他类型的分析。通过这种方法,部分自动化的文献挖掘可以帮助快速创建半结构化的知识库,用于自动分析新出现的健康威胁。
  论文地址:「链接」
  资源推荐
  标题:孟加拉国工程技术大学、加州大学洛杉矶分校等 | CrossSum:超越 1500 多个语言对的以英语为中心的跨语言抽象文本摘要数据集
  简介:作者提供了 CrossSum:一个包含 165 万个跨语言文章摘要样本、包含 45 种语言的 1500 多个语言对的大规模数据集。基于多语言 XL-Sum 数据集,并使用与语言无关的表示模型通过跨语言检索来对齐以不同语言编写的相同文章,作者提出了一种多阶段数据采样算法并微调多语言预训练模型mT5。实验结果表明在 CrossSum 上微调的模型优于摘要+翻译基线。
  论文地址:「链接」
  资源下载:https://github.com/csebuetnlp/CrossSum
  【关于转载】本文转载于公众号"智源社区",仅用于学术分享,有任何问题请与我们联系:report@aminer.cn

坚持十年当红娘长安汽车以行动关爱青年,祝福真爱!10月30日,爱有新益有你更好2021年重庆市青年集体婚礼暨长安汽车第十届青年集体婚礼在重庆市江津区保坪村浪漫举行,活动以乡村振兴为主题,携手重庆本地乡镇产业,以直播带货爱心助农等不要CEO,不要退休,不要八卦,为什么张一鸣只要未来?在520这个特别的一天,我吃了一惊,张一鸣辞去了如日中天的字节跳动CEO。那么他为啥要辞,早不辞迟不迟要在今天辞,今天是什么日子啊,难道他要与字节跳动决裂?否也。张一鸣还是很有深度全球芯片疯狂涨价,原来是在为他们做的嫁衣告诉你一个芯片涨价的真相,信不信由你全球财经观察新闻速递视半导体行业国际团体SEMI于6月3日发布数据称,2021年13月半导体制造设备的全球销售额同比增长51,达到235亿美元。新房装修不烦恼!卡萨帝联合秘改设计师带来成套解决方案根据行业相关数据,预计到2023年,中国的家装市场容量将达到3。23万亿,而作为消费主力的80后90后年轻人,却有37选择可以拎包入住的整体家装方案。究其原因,在于装修太费心,其中豌豆思维老师孩子启蒙的放心选择乘风破浪的姐姐2的火热开播,也让豌豆思维进入了更多人的视野,和各位乘风破浪的姐姐一样,豌豆思维老师也在为了孩子的成长乘风破浪。在豌豆思维老师的带领下,许多学生逐渐地消除了对学习的抵90后厂二代,如何在1688厂货第一展打开全国销路文苏頔编辑文若浙江永康市,五金之都。永康手工业源远流长,千工百匠父子相传,师徒相授。玻璃制造是其中一类,产业相关企业在当地数以千计,集群优势显著。他们大多从家庭作坊起步,逐渐发展建平安人寿斩获国际语义测评竞赛SemEval2021多项大奖近日,在由国际计算语言学协会(AssociationforComputationalLinguistics,ACL)主办的国际语义评测大赛SemEval2021(Internati冰洗增幅第一!卡萨帝场景拉动夯实行业地位2020年过后,用户更加注重家电产品的健康功能,随着开年市场需求明显回升,健康高端智能化场景化将成为行业新战场。这一趋势在市场中有明显表现。就拿高端家电品牌卡萨帝来说,累计至9周的精装房设计都一样?海尔全屋空气方案每个房间都不同日前,中国房地产开发企业500强榜单发布,万科排名综合实力榜首。3月22日,在榜单发布一周后,万科地产股份有限公司又传来最新消息在20212023年地产项目空调配套商中,选择海尔中追本溯源再现经典,匠心工艺新生灵耀14s山川黛视频加载中近年来,华硕灵耀系列轻薄笔记本以强劲的性能和越级轻薄体验,赢得了轻薄笔记本市场良好口碑,同时灵耀在科技领域以弘扬中国传统文化为担当,致力于用现代科技的方式呈现经典,制定了卡萨帝新品冰箱发力智慧厨房场景,解决用户厨居烦恼装修厨房,通常都要预留好冰箱厨电的空间。但是无论怎么留空间,通常都会让空间更富裕一些,不过这样也会带来不足,就是冰箱与橱柜之间会有510cm缝隙,不仅影响美观,还容易藏灰磕脚。那还
给力!中国移动四大特权奉上,十年没换号的用户可免费用关注通信技术的朋友们都知道,移动通信每隔十年,技术会跃迁一次,这依然成为了发展规律。对于我们国内的情况而言,2016年1月份,中国5G技术研发试验正式启动。而且同年,由多国联合主办击败海尔美的,出口量蝉联全球第一,国产冰箱诞生隐形冠军一直以来,提到国内冰箱厂商,大家首先想到的便是海尔冰箱。即便在2020年经历特殊卫生事件,海尔冰箱依旧交出了国内销量1518万台的满意答卷,市场占有率更是达到17。98,毫无疑问,推荐3款值得买的旗舰机颜值性能兼备,总有一款适合你朋友们,大家好!欢迎您点开笑呵呵的小丑的文章,您的每一次浏览都是对小编最大的鼓励!事不宜迟,咱们进入本篇的正题。现在已经是2021年的下半年了,各大手机厂商纷纷发布了自己的旗舰新机2021年购买新手机,熟知这4个最低标准,基本上十拿九稳2021年购买一款称心如意的旗舰手机,我们应该熟知4个最低标准,只要这款旗舰机可以满足这些最低标准,基本上就十拿九稳了,如果有缺失的话,其实笔者不太建议入手,除非一些比较特殊的机型国产屏崛起,TCL华星开始向三星电子少量供货OLED一直以来,在屏幕面板行业都掌握在日韩手里,尤其是三星,其OLED显示面板可以说是业内最好的,其国内的许多厂商的手机都是搭载三星的OLED显示面板。不过近些年来,国内屏幕面板厂商的实全民折叠屏,谷歌折叠屏手机曝光,或与Pixel6同期发布安卓亲儿子6。0,谷歌Pixel6系列基本确定将于10月份前后发布,同时谷歌Pixel6系列的外观及配置基本曝光得差不多了。谷歌Pixel6系列此次最大的变化就是将搭载自研芯片TeiPhone备忘录隐藏小技巧汇总大家都知道iPhone手机的备忘录功能又多又好用,但你都会用吗?以下是iPhone备忘录隐藏小技巧,一起来看看你用过几个。在备忘录中想要快速的全选所有文字,用手指单指三击即可在备忘3A玩家必备好物宏碁FA100SSD,高速读写加载游戏不等待自从上个游戏世代之后,由于更加精细的高分辨率贴图和更多的特效,让主流3A游戏的体积成倍增长。以前PS3时代一款3A游戏可能只有20GB不到,而现在数十乃至上百GB的游戏都不少见,很预算500左右?骁龙710光学防抖线性马达?香吧如果预算500左右?想要买一台全面屏手机,有哪些机型可以选择?看到这里,有些人可能就直接愣了,表示现在还有500左右的全面屏手机?怕不是山寨的吧。对此,笔者就想说那你就有所不知了,所谓一物降一物,请问原子弹有啥东西可以降住它?什么东西可以克制原子弹呢?其实如果一个国家没有核武器,那么,实体的东西,没有什么可以克制原子弹!任你雄师百万,钢铁洪流,面对几十万吨当量的原子弹,可以说不堪一击!有的朋友觉得,核武有没有可以在iPad看文献体验超棒的软件?ipad凭借着流畅的运行速度,丰富的软件应用,深受用户的喜爱,ipad在不同的场景下可以发挥出不同的作用,比如很多的职场人士使用ipad来进行办公,很多学生用户使用ipad来进行学