范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

一层卷积能做啥?BOE告诉你一层卷积可以做超分!

  作者丨Happy
  来源丨AIWalker
  编辑丨极市平台
  arXiv: https://arxiv.org/pdf/2108.10335.pdf
  本文是京东方团队关于端侧超分的深度思考, 以端侧设备超分为切入点,对经典上采样与深度学习超分之间的"空白"地带进行思考,提出了一类"一层"超分架构 (脑洞真的太大了),并对所提方案与其他轻量型超分方案以及bicubic从不同角度进行了对比,同时也为未来端侧超分算法的设计提供了一个极具价值的参考点。 Abstract
  经典的图像缩放(比如bicubic)可以视作一个卷积层+一个上采样滤波器,它在所有显示设备与图像处理软件中是普遍存在的。
  在过去的十年里,深度学习技术已被成功应用到图像超分任务上,它们往往由多个卷积与大量滤波器构成。深度学习方法已成功占据了图像上采样任务的质量基准。 深度学习方法能否在端侧设备(比如显示屏、平板电脑以及笔记本电脑)上取代经典上采样技术吗  ?一方面,随着能高效运行深度学习任务的硬件的迅速发展,AI芯片发展趋势呈现出了非常好的前景;另一方面,只有少数SR架构能够在端侧设备上实时处理非常小尺寸图像。
  我们对该问题的可能方案进行了探索以期弥补经典上采样与轻量深度学习超分之间的空白。作为从经典到深度学习上采样之间的过渡,我们提出了edge-SR(eSR):一层架构,它采用可解释机制进行图像上采样。当然,一层架构无法达到与深度学习方法的性能,但是,对于高速度需求来说,eSR具有更好的图像质量-推理速度均衡。弥补经典与深度学习上采样之间的空白对于大量采用该技术非常重要。
  本文贡献包含以下几点: 提出了几种一层架构以弥补经典与深度学习上采样之间的空白; 在1185中深度学习架构中进行了穷举搜索,可参考上图,不同的架构具有不同的性能-速度均衡。 对一层自注意力架构进行了可解释分析,对自注意力机制提供了一种新的解释。
  上述结果可能会带来以下影响: 图像超分系统有可能大量应用到端侧设备; 对小网络的内部学习机制有更好的理解; 对未来应用于研究了一个更好的性能-耗时均衡参考。 Super-Resolution for Edge Devices
  Classical  图像上采样与下采样指的是LR与HR之间的转换。最简单的下采样有pooling、downsample。downsample一半是在水平和垂直方向进行均匀的像素丢弃,这种处理会导致高频信息丢失,导致Alisaing问题。为解决该问题,经典的线性下采样首先采用anti-aliasing低通滤波器移除高频,然后再下采样。现有深度学习框架中采用stride convolution实现。线性上采样则与之相反,下图给出了实现可视化图,即 先上采样后滤波  。
  由于引入过多零,造成大量的资源浪费,上图中的定义实现非常低效。本文提出了一种高效实现,见上图下部分,即先滤波再pixelshuffle。注:作者采用标准bicubi插值滤波器系数进行验证,两者具有完全相同的结果。
  Maxout  本文提出的首个一层网络为edge-SR Maximum(eSR-MAX),见下图。
  class edgeSR_MAX(nn.Module):       def __init__(self, C, k, s):           super().__init__()           self.pixel_shuffle = nn.PixelShuffle(s)           self.filter = nn.Conv2d(1,s*s*C,k,1,(k-1)//2,bias=False)       def forward(self, x):           return self.pixel_shuffle(self.filter(x)).max(dim=1, keepdim=True)[0]
  Self-Attention  本文提出的第二个一层网络为edge-SR Template Matching(eSR-TM)。下图给出了该方案的解释示意图,它利用了模板匹配的思想。
  class edgeSR_TM(nn.Module):       def __init__(self, C, k, s):            super().__init__()            self.pixel_shuffle = nn.PixelShuffle(s)            self.softmax = nn.Softmax(dim=1)            self.filter = nn.Conv2d(1,2*s*s*C,k,1,(k-1)//2,bias=False)        def forward(self, x):            filtered = self.pixel_shuffle(self.filter(x)            B,C,H,W  = filtered.shape            filtered = filtered.view(B,2,C,H,W)            upscaling= filtered[:,0]            matching = filtered[:,1]            return torch.sum(upscaling * self.softmax(matching), dim=1, keepdim=True)
  Transformer  本文提出的第三种方案是edge-SR TRansformer(eSR-TR),见下图,它采用了Transformer的自注意力机制,某种程度上时eSR-TM的简化。
  class edgeSR_TR(nn.Module):       def __init__(self, C, k, s):            self.pixel_shuffle = nn.PixelShuffle(s)            self.softmax = nn.Softmax(dim=1)            self.filter = nn.Conv2d(1,3*s*s*C,k,1,(k-1)//2,bias=False)        def forward(self, x):            filtered = self.pixel_shuffle(self.filter(x))            B,C,H,W  = filtered.shape            filtered = filtered.view(B,3,C,H,W)            value = filtered[:,0]            query = filtered[:,1]            key   = filtered[:,2]            return torch.sum(value*self.softmax(query*key),dim=1,keepdim=True)
  edge-SR CNN  此外本文还提出了edge-SR CNN(eSR-CNN),见上图c。下图给出了所提几种方案的算法实现。
  class edgeSR_CNN(nn.Module):       def __init__(self, C, D, S, s):           super().__init__()           self.softmax = nn.Softmax(dim=1)           if D == 0:               self.filter = nn.Sequential(                           nn.Conv2d(D, S, 3, 1, 1),                           nn.Tanh(),                           nn.Conv2d(S,2*s*s*C,3,1,1,bias=False),                           nn.PixelShuffle(s))           else:               self.filter = nn.Sequential(                           nn.Conv2d(1, D, 5, 1, 2),                           nn.Tanh(),                           nn.Conv2d(D, S, 3, 1, 1),                           nn.Tanh(),                           nn.Conv2d(S,2*s*s*C,3,1,1,bias=False),                           nn.PixelShuffle(s))       def forward(self, input):           filtered = self.filter(input)           B, C, H, W = filtered.shape           filtered = filtered.view(B, 2, C, H, W)           upscaling = filtered[:, 0]           matching = filtered[:, 1]           return torch.sum(upscaling * self.softmax(matching), dim=1, keepdim=True)
  Deep-Learning  作为对标,本文以FSRCNN、ESPCN为候选,结构见下图。两者的区别有两点:激活函数、上采样方式。
  Experiments
  上图所构建的1185超分模型池,训练数据采用General100与T91进行,模型的输入为1通道灰度图像。整个训练过程花费了两个月时间@Tesla M40GPUX7。为测试最终模型,主要考虑了两种推理设备: Nvidia Jetson AGX Xavier:Nvidia公司的嵌入式GPU设备,功耗30Watt; Raspberry Pi 400:树莓派CPU处理器,功耗15Watt。
  测试过程中,每个模型的输出为14个Full-HD图像,测试集源自DIV2K。推理过程采用FP16推理。图像质量评价则采用了Set5、Set14、BSDS100、Urban100以及Manga109等基准数据集。
  上图对比了不同方案的性能-速度,以bicubic作为基准,从中可以看拿到: 在端侧GPU设备上,所提edge-SR成功弥补了经典上采样与深度学习超分之间的空白,同时具有比bicubic上采样更好的速度-质量均衡; 在树莓派CPU设备上,edge-SR弥补了x2与x3倍率下的空白,但x4任务上bicubic上采样具有更佳的性能。 深度学习方案更擅长于提升图像质量,如ESPCN在高质量范围具有最快速度; eSR-CNN并未提升ESPCN质量,但提升了其速度; eSR-MAX具有最快速度,但质量不稳定; eSR-TM与eSR-TR在中等速度-质量方面具有最佳性能。
  上表给出了不同方案的性能,可以看到: eSR方案取得了最佳速度、最低功耗  ,同时具有比bicubic上采样更好的图像质量。
  上述两个图对eSR-TM与eSR-TR进行了可视化解释,从中可以看到: 对于eSR-TM而言,不同滤波器处理不同频率带;尽管滤波器不平滑,但具有一定程度的方向辨别能力; 对于eSR-TR而言,matching与上采样滤波器同样不平滑,但有一定的方向性。 个人反思
  视频类low-level算法想落地到端侧,尤其是要求 高分辨率+实时推理  时,难度真的非常大,谁做谁知道。性能好的模型,速度完全跟不上;但是要速度快吧,性能又不突出, 视频low-level算法真的适合用AI吗  ?
  京东方的研究员脑洞实在太大了,不去关注性能,转而去关注bicubic插值与深度学习超分方案在性能-速度均衡之间的那块"空白区域",进而提出了"脑洞"更大的一层超分模型!一层能干啥?在看到该文之前,真是想都不敢想。
  就算是一层模型,京东方的研究员也是玩出了花样,又是Maxout,又是模板匹配、又是Transformer,真是大写的 !
  比较可惜的是这篇文章并未开源,虽然复现很简单,但作为"拿来主义"的我,有训练好的谁还去重新训练呢,对吧...

黑石资本暴雷!或复刻08年次贷危机,这次美国救不救?好内容我来评这两天金融圈的人都在转发一条消息黑石资本竟然暴雷了!这条消息之所以重要,是因为黑石可不是什么阿猫阿狗,它的资产接近万亿美元,号称华尔街资本之王,是全球最大的私募股权基金美国4名游客墨西哥被绑,两人死亡,当地黑帮认错人,以为游客抢生意墨西哥东北边陲近日上演惊魂一幕4名赴墨自驾游的美国游客在光天化日之下遭到当地黑帮的袭击与绑架。两人死亡,另外两名幸存者已被安全送回美国。这场震动美墨的绑架事件调查结果近日公布,是一中国科学院新疆天文台首次发现近地小行星中新社乌鲁木齐3月7日电(记者孙亭文)记者7日从中国科学院新疆天文台获悉,今年2月底,中科院新疆天文台南山站1米大视场光学望远镜(NOWT)首次发现了一颗近地小行星。近日,国际小行48岁孔令辉还没结婚,42岁马苏还是单身,一个人逛路边摊被偷拍说到孔令辉相信很多球迷朋友不会陌生,孔令辉是国乒的骄傲,球员时期的孔令辉比刘国梁还要出色,被大家称为乒乓球王子,同时也是继刘国梁之后第二个夺得大满贯的球员。孔令辉退役后也没有离开国Grazia丨2023年3月意大利杂志大片grazia是1938年诞生于意大利的时装周刊,由意大利消费类杂志出版社Mondadori出版。70年来始终是意大利权威畅销的时装周刊,也是欧洲具影响力的时尚杂志之一。中文版的红秀库克后院遭遇大火,印度供应商玩火自焚,苹果撤离中国无望作为全球最大的智能手机制造商之一,苹果公司因其高端时尚创新的产品而广受消费者和粉丝的追捧,同时也是最盈利丰厚的科技公司之一。然而,苹果在其经营过程中也遇到了来自不同方面的巨大挑战和俄乌冲突,乌克兰不想打了?俄乌冲突,乌克兰不想打了?3月4日华尔街日报称,俄乌冲突爆发一周年之际,乌克兰总统泽连斯基曾经对法国总统马克龙表示,要想解决乌克兰问题,让乌克兰重新回归和平,让欧洲大陆保持持久的稳19世纪,英国注意到印度女性生产问题,发展女性教育与西医的必要历史开讲跟茶园工厂里的女性劳工不同,女医师和助产士的就业状况,在一定程度上反映了殖民地印度知识女性在专业技术领域中就业的一般情形。印度妇女因为与男性隔离开来,医疗看病问题一直不能很谁还傻傻开通银行卡短信通知?教你方法,不花钱也能免费收到提醒我们开银行卡时,一般都会直接让银行帮我们开通银行卡短信通知,但大家有没有发现这个短信普通的是收费的。如果我们开了这个短信通知,一个月要多花好几块钱才能收到提醒。但其实银行卡是不需要停气通知!连续2天!涉及绵阳多个区域,快来看看有没有你家3月8日,据绵阳燃气集团消息,因抢险,3月9日3月10日计划对以下区域进行停气。请用户做好生产生活安排,注意关闭燃气阀门,由此带来的不便,敬请谅解。3月9日停气通知因抢险,绵阳兴绵欧美黄热病背后的可怕真相西方男性为何钟爱亚裔女性?你可能听说过黄热病这个词,它指的是一些西方男性对亚洲女性有着强烈的偏好和迷恋。他们认为亚洲女性温柔顺从贤惠性感,是理想的伴侣和情人。但这种看法其实是一种畸形的幻想,它背后隐藏着殖民
布局一带四区六环多点预计2025年森林旅游产值2000亿元广东重点发展森林旅游新业态,图为广州市白江湖森林公园。南方日报记者符超军钟晓宇摄记者从广东省林业局获悉,广东省森林旅游发展规划(20212035年)(以下简称规划)近日已印发,明确点赞!晋城这条线路入选稻花香里说丰年全国乡村旅游精品线路乡村四时风光不同丰收金秋格外精彩近日文化和旅游部联合共青团中央推出稻花香里说丰年全国乡村旅游精品线路128条晋城多彩洞头乡村之旅入选线路简介洞头村,点缀在太行山水之间,契合明清历史世界旅游日,跟侣行夫妇云游三晋大地你有多久没出门看过外面的风景?你是否也怀念微风拂过草地时带来的泥土清香?你是否也曾畅想旅行路上的奇遇和惊喜?这就是旅行的魅力永远在路上,每一天都能迎接新的风景和故事。今天是世界旅游甘肃红色旅游精品线路全在这里庆阳市华池县南梁景区日前,甘肃省文旅厅推出红色陇原行甘肃人游甘肃7大主题35条红色旅游精品线路,将省内众多红色资源和特色旅游景点串联成线,引导广大干部群众在寓教于游中感悟时代进步,盘点那些年的一代神机,款款都是经典!你用过哪些?文名动科技智能手机发展至今,也历经了10多年的时间。期间市场中不乏出现了一些精品手机,实现了销量口碑双丰收,所以在本期,我就来和大家盘点下那些年的一代神机,看看有没有你用过,或者目小牛电动全新UQi初体验智能又贴心,日常通勤的最佳伴侣作为一个经常有短途出行需求的人,对两轮电动车的选择也十分苛刻,便捷好骑只是基础,能够完全满足个性化需求的电动车其实并不多。不过,小牛电动全新UQi是个例外,它用实力超越了我对电动车比亚迪又火了!便宜的新能源小轿车之一只要你不是藤原拓海,其实大部分的车辆动力也都足够你日常使用了。不知道你有没有了解过今天介绍的比亚迪e2。现在就让大家跟着小编一起来看看它都有哪些表现吧。首先从外观来看,比亚迪e2车VivoS16Pro冲击高端,天玑900016GB,真香机有了新体验近几年Vivo手机变化相当大,自从iQOO加入后,市场占有率大幅提升,竞争力全面加强。Vivo主品牌也不甘示弱,X系列机型全面爆发,大屏旗舰VivoXNote回归,X80系列多版本敢越级的5款千元机,有颜值又有性能,向您诚恳推荐,再战3年您在阅读前请点击上面的关注二字,后续会第一时间为您提供更多有价值的相关内容,感谢您的支持。现在的千元机性能有了很大的提升,可以说拥有越级的体验,虽然价格只有千元,但是却拥有3000iPhone14的首批差评毫不客气,老问题依旧,灵动岛不灵iPhone14系列的发布,让死寂的手机市场一下子活跃了起来,而当苹果新机发布已有些时日之后,现在回想你最喜欢iPhone14的哪一点,拍照A16续航灵动岛等?手机已经发布之后,就单位停产放假欠下大量的养老保险费和滞纳金怎么办?职工承担吗?用人单位一旦经营情况不好,可能就会停产放假。但是,用人单位只要不解除劳动关系,就应当给职工缴纳社会保险。一些用人单位由于停产,没有充足的现金流,就会导致社会保险费的拖欠。按照规定,