范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

这个深度学习库能执行10多种图像文本任务,还统一接口已开源

  Pine 发自 凹非寺
  量子位 | 公众号 QbitAI
  支持10余种图像文本任务 ,囊括20多种数据集 ,还提供SOTA模型性能和可复现预训练及微调实验配置 。
  没错,这是一个视觉语言深度学习框架就可以拥有的。
  这个库的庐山真面目是:Salesforce亚洲研究院推出的LAVIS。
  并且,它还统一了接口,降低开发成本和入门门槛。
  最重要的是:已开源!
  LAVIS全⽅位⽀持 视觉语⾔任务、数据集、模型。
  如果还不能看不出它的优势,那话不多说,直接看LAVIS与现有多模态库的对比图。
  相较之下,现存的视觉语⾔框架只⽀持较少⼀部分任务和数据集,逊色了不少。
  除此之外,LAVIS还附带了丰富的开源资源和⼯具,就比如说它提供了一个图形化的工具,可以可视化数据集的样本,以便于能更好的预览、理解数据。
  并且随着LAVIS一起开源的还有GUI demo,它的功能就有这么多。(看图)
  具体LAVIS有何过人之处?一起来看看吧~
  ⼀站式视觉语⾔框架
  LAVIS概括下来,可以用三个数字来表示:四、十、二十 。
  先来说说四 ,它表示LAVIS支持四种领先的基础视觉语⾔模型架构,包括ALBEF、BLIP、CLIP和ALPRO。
  其中ALBEF和CLIP主要支持图像文本任务,ALPRO⽀持视频⽂本任务,BLIP对这两项任务都能够提供⽀持。
  也正是有了这些视觉语言模型做基础,LAVIS才能够运行这十 余种视觉语言任务。
  具体来讲,它可以进行图⽚描述⽣成、图像⽂本检索、视频⽂本检索、图像问答、视频问答、多模态分 类、多模态图像、视频对话、视觉语⾔推理、多模态预训练等实⽤任务。
  除此之外,LAVIS还具备多模态特征提取等功能。
  讲完模型架构和任务,就还差数据集了,不过这就不必担心,因为LAVIS能够支持二十 多种数据集。
  想实现各项任务都能够找到合适的数据集进行训练。
  不过,这些都还只是LAVIS的开碟小菜,它还"憋了个大招":
  统一接口。
  这对初学者和跨领域研究者来说是相当友好了,许多深度学习库的模型、数据集一集任务评估接口都不一致,这就导致学习成本大大提高。
  而统一接口之后,就会极⼤简化模型训练评测,并且能够最⼩化重复开发成本。
  话说回来,这里的统一接口具体方便了什么呢?
  主要分为两部分。
  第一部分是用于加载数据集和模型 的统一接口,模型及其相关的预处理器也可以通过一个统一的接口来加载,从而便于对自定义数据进行分析和推断。
  第二部分是实现多模态特征提取 的统一接口,这些特性对于端到端微调的离线应用程序尤其有用。通过更改名称和模式,用户可以选择使用不同的模型架构和预先训练的权重。
  这样一来,⽤户便可以利⽤LAVIS提供的load_model(), load_dataset() ,⼀键加载 所需模型和数据集。
  比如说,加载COCO captioning数据集,只需要输入load_dataset("coco_caption") ;加载BLIP captioning模型只需要输入model=load_model(name="blip_caption") 。
  此外,LAVIS还能实现数据到训练⾼定制化 ,给予开发者充分空间研究新模型、新多模态能⼒、新引⽤场景。
  不过,实现LAVIS这样一站式的视觉语言框架,是怎样做到的呢?模块化的结构
  其实从LAVIS的构造就能够看出,LAVIS深度学习库的整个构造很简洁,用三个字就可以概括:模块化 。
  在整个库中,将关键组件模块化后再进行组织。
  这样一来,就可以对单个组件的现成访问、快速开发以及新组件或外部组件的轻松集成,还能够模型推断,例如多模态特征提取。
  具体是怎样的?可以一起看看。
  LAVIS共分为六个关键模块(详见下图) 。
  其中比较核心的就是runners 模块,它负责管理整个训练的评估的过程,RunnerBase和RunnerIters也各司其职,一个负责基于epoch的训练,一个负责基于迭代的训练。
  tasks 模块会对每个任务执行具体的训练和评估逻辑,以适应特定的任务。
  datasets 顾名思义就是负责创建数据集。
  在models 模块中,它保存了其支持的四个模型以及共享模型层的定义。
  processors 模块用来处理多模态输入的预处理,处理器将输入的图像、视频和文本转换为模型可以使用的形式。
  common 则是LAVIS提供的工具包和一些应用程序。
  这些模块之间相互依赖,由此便形成了一个简单而统一的库,进而可以更方便地训练和评估模型;访问所支持的模型和数据集以及扩展新模型、任务和数据集。
  目前,开发人员表示将持续更新维护LAVIS,在未来它将会支持更多更强大的视觉语言预训练模型,和更多的视觉语言任务,比如文本图像生成。
  听完是不是心痒痒了?
  下方就有开源链接以及详细文档,感兴趣的朋友可以试试~
  Github:https://github.com/salesforce/LAVIS
  技术报告:https://arxiv.org/abs/2209.09019
  ⽀持⽂档:https://opensource.salesforce.com/LAVIS//latest/index.html
  官⽅博客:https://blog.salesforceairesearch.com/lavis-language-vision-library/
  — 完 —
  量子位 QbitAI · 头条号签约
  关注我们,第一时间获知前沿科技动态

文案用很久的微信签名头条创作挑战赛我是市井小民梦想自由幸运。1。行远回首才觉见山仍是山。2。日升月落,总有黎明。3。不要讨好冷漠,不要辜负热情。4。站在世俗里,难免被遗忘。5。没有天赋,不断重复。6。抄书第十三天,收益越来越好啦今天抄书十三天啦,你再优秀,也总有人对你不堪。你再不堪,也有人认为是限量版的唯一。生命的价值在于自己看得起自己,人生的意义在于努力。今天抄的是每天改变一点,离成功近一点春秋战国时期天气预报明天12月2号雨雪降温范围确认,今年是冷冬?农谚咋说导读,天气预报明天12月2号雨雪降温范围确认,今年是冷冬?农谚咋说。十一月再见,十二月,你好!春夏秋冬,交替更迭,时光不饶人,眨眼的功夫,已进入四季之末的冬,一晃,这一年又至尽头,武姿已经想好,真想柔柔地叫一声老公,这些年你折磨得我好苦老表哥的老伴去世几年了,他过上了一人吃饱,全家不饿的孤独生活。于是,有人连开玩笑,带认真地劝老表哥再个找老伴。其实,这也是在很大程度上觉得他这个人人品好,退休金也不低,身体也没有大简忆纤之来,肠道清道夫我以为我了解肠道清道夫,但我真的了解肠道清道夫吗?仔细想想,我对肠道清道夫的理解只是皮毛而已。拉伯雷在过去曾经讲过,望见了海岸才溺死,是死得双倍凄。这段话看似复杂,其中的逻辑思路却过往不恋,未来不许一季一景,一岁一礼,一份欣喜。灼灼岁序,时光荏苒。转身之间,秋去冬来。十一月已销声匿迹,十二月如期而至。岁月极美,在于它必然地消逝。因为四季的变换,人生才有起落因为生命的流转,万事有好嘴,才会有好福气01hr人活着,一定要记住,有些话不能说,一张口就全是抱怨的话,那生活也跟着遭殃,一张口就全是积极正能量的话,生活也跟着顺风顺水。说话看似是一件不起眼的小事,却能折射出一个人的智慧成本28元,要价800元?听懂话术,避开家电维修套路今日女报凤网记者吴雯倩趁着我没注意,维修工把号称四五百块钱一瓶的疏通剂哐哐往管道里倒,足足有十几瓶!最近,上海王女士通过58同城网络平台,联系了一家家政维修公司提供马桶疏通服务,没酗酒酗出来的人生意义Quitdrinking(戒酒)到今天满月了。相对于正常人,我自认自己是有问题的,酗酒本身就是个大问题。到今天整整一个月滴酒未沾,这对普通人来说无可厚非,不值一提。但对自己却是巨大人生最顶级的智慧,绝境不慌白居易曾在太行路里这样说行路难,不在水,不在山,只在人情反覆间。路的难走,不在路的形态,而在于人心。一个人若是做到困境不慌,绝境不怂,以及做到顺境不傲,方能真正笑傲人生。人在顺境时12月你好图片,十一月再见十二月你好唯美语录说说心情句子青春是蓬勃向上,积极进取的象征,是奋斗的黄金时期。我告诉自己我不想做一个终生空虚而又碌碌无为的人。我踏下的每一步,都应该稳重而又踏实。11月再见,12月你好,早安!连自己的未来都不
人老了,想要不被儿女嫌弃,一定要做好这些事情前言在我们的生活当中有很多事情不是那么容易,我们一定要掌握正确的技巧,如果不能够掌握正确的技巧,生活就不好过,人生也不会那么幸福,其实在更多的时候,我们一定要明白生活的意义,只有这中兴通讯助力张家界移动完成OTN替换SDH试点近日,中兴通讯助力张家界移动完成SDH现网骨干汇聚层网络的全面替换,实现VCOTN与SDH接入层全面融合,并完成专线业务割接,使张家界移动的光网络具备多业务承载能力,显著提升其网络网球王子U17第十集比骚局开始,谁更骚谁就能赢头条创作挑战赛上一集还讲到龙马退出美国队,再入日本队,已经足够震惊一整年。本以为这一集龙马会出场,结果这一集只打了一场。看来官方是打算调整一下节奏了,毕竟没有高光时刻的日本队,好像人民币对美元汇率逼近7元时代,发生了啥?是否破7?中新网9月8日电(首席财经记者李金磊)人民币对美元汇率正逼近7元时代。人民币会否破7引发关注。(9月7日人民币汇率中间价)中国人民银行授权中国外汇交易中心公布,2022年9月7日银国家1万亿的保交楼政策已经执行到地方,房价大概率已经触底国家1万亿的保交楼政策已经执行到地方,大概率房地产价格已经触底,刚需客户可以安全上车了。从2022年7月28日中央政治局会议提出保交楼,到现在一个多月过去了。一万亿的救市政策已经开生猪养殖行业深度报告规模化跃进中的周期矛盾与成长机遇(报告出品方作者天风证券,吴立陈潇陈炼)一中国养猪规模化大势所趋养猪规模化趋势不可逆进入21世纪以来,随着我国农村形势的变化,生猪养殖方式开始向规模化集约化方向发展,散户养殖主体在英国女王逝世前,遛狗烧烤散步心情好,知情人称她是突然去世英国女王伊丽莎白二世在9月8日下午4点30分与世长辞,她的生命定格在了这一刻。白金汉宫门外,围绕着成千上万的英国民众,他们从四面八方赶了回来,悼念他们心中最爱的女王陛下,英国随后进对于灰色强奸你了解多少?强奸原本就是可怕的存在了,没想到灰色强奸比强奸更加的可怕,受害者明明被侵犯了,可她意识不到这是强奸,不敢去声张,也不敢去报警!这就使得坏人连连得手!一真实案例回顾小芬是一名研究生,怀孕后要瞒三月并非迷信,老一辈的话是有一定道理的,别不听眼看小娟都要30岁了,她的肚子依旧没有动静。小娟和丈夫结婚已经五年了,这五年来,小娟感受了无数次的失望,同村的姐妹们结婚后都纷纷怀孕报喜,而自己却一直怀不上。如果下个月还是怀不上,乌西克我不会在12月重返拳击赛场,因为我需要休息在第二次击败了安东尼约书亚后,现任WBA超级WBO,IBF,IBO和拳击杂志重量级世界拳王奥列克桑德尔乌西克(OleksandrUsyk)已经开始规划自己的下一场比赛了。虽然在比赛宋丹丹儿媳背15万元包出游,正处哺乳期脸色憔悴,夫妻俩打情骂俏提及如今娱乐圈中最朴实无华不啃老的星二代,多数人第一个想到的就是他了,他就是宋丹丹的儿子巴图,一直以来跟妻子靠着直播赚的盆满钵满,自力更生,让人非常佩服。这也是宋丹丹这个做妈妈的教