范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

参数量仅为原来1,北邮等利用超分算法提出高性能视频传输方法

  机器之心专栏
  北京邮电大学-模式识别与智能系统实验室
  来自北京邮电大学和英特尔中国研究院的研究团队创新性地利用超分辩率算法定义了网络视频传输任务,减小了网络视频传输的带宽压力。
  互联网视频在过去几年发生了爆发式增长,这给视频传输基础设施带来了巨大的负担。网络视频传输系统的质量很大程度上取决于网络带宽。受客户端 / 服务器日益增长的计算能力和深度学习的最新进展的启发,一些工作提出将深度神经网络 (DNN) 应用于视频传输系统的工作,以提高视频传输质量。这些 DNN 的方法将一整个视频平均分成一些视频段,然后传输低分辨率的视频段和其对应的 context-aware 模型到客户端,客户端用这些训练好的模型推理对应的低分辨率视频段。通过这种方式,可以在有限的互联网带宽下获得更好的用户体验质量 (QoE)。其中,传输一段长视频需要同时传输多个超分辨率模型。
  近日,来自北京邮电大学和英特尔中国研究院的研究者首先探索了不同视频段所对应的不同模型间的关系,然后设计了一种引入内容感知特征调制(Content-aware Feature Modulation,CaFM)模块的联合训练框架,用来压缩视频传输中所需传输的模型大小。该研究的方法让每一个视频段只需传输原模型参数量的 1%,同时还达到了更好的超分效果。该研究进行了大量的实验在多种超分辨率 backbone、视频时长和超分缩放因子上展现了该方法的优势和通用性。另外,该方法也可以被看作是一种新的视频编解码方式。在相同的带宽压缩下,该方法的性能(PSNR)优于商用的 H.264 和 H.265,体现了在行业应用中的潜能。
  论文链接:http://arxiv.org/abs/2108.08202GitHub 地址:https://github.com/Neural-video-delivery/CaFM-Pytorch-ICCV2021
  与当前单图像超分辨率 (SISR)和视频超分辨率 (VSR)的方法相比,内容感知 DNN 利用神经网络的过拟合特性和训练策略来实现更高的性能。具体来说,首先将一个视频分成几段,然后为每段视频训练一个单独的 DNN。低分辨率视频段和对应的模型通过网络传输给客户端。不同的 backbone 都可以作为每个视频段的模型。与 WebRTC 等商业视频传输技术相比,这种基于 DNN 的视频传输系统取得了更好的性能。
  尽管将 DNN 应用于视频传输很有前景,但现有方法仍然存在一些局限性。一个主要的限制是它们需要为每个视频段训练一个 DNN,从而导致一个长视频有大量单独的模型。这为实际的视频传输系统带来了额外的存储和带宽成本。在本文中,研究者首先仔细研究了不同视频段的模型之间的关系。尽管这些模型在不同的视频段上实现了过拟合,但该研究观察到它们的特征图之间存在线性关系,并且可以通过内容感知特征调制(CaFM)模块进行建模。这促使研究者设计了一种方法,使得模型可以共享大部分参数并仅为每个视频段保留私有的 CaFM 层。然而,与单独训练的模型相比,直接微调私有参数无法获得有竞争力的性能。因此,研究者进一步设计了一个巧妙的联合训练框架,该框架同时训练所有视频段的共享参数和私有参数。通过这种方式,与单独训练的多个模型相比,该方法可以获得相对更好的性能。
  该研究的主要贡献包括:提出了一种新颖的内容感知特征调制(CaFM)模块的联合训练框架,用于网络间的视频传输;对各种超分辨率 backbone、视频时间长度和缩放因子进行了广泛的实验,证明了该方法的优势和通用性;在相同的带宽压缩下,与商业 H.264 和 H.265 标准进行比较,由于过度拟合的特性,该方法展示了更有潜力的结果。
  图 1
  方法
  神经网络视频传输是在传输互联网视频时利用 DNN 来节省带宽。与传统的视频传输系统不同,它们用低分辩率视频和内容感知模型取代了高分辨率视频。如上图所示,整个过程包括三个阶段:(i)在服务器上对每个视频段的模型进行训练;(ii) 将低分辨率视频段与内容感知模型一起从服务器传送到客户端;(iii) 客户端上对低分辨率视频进行超分工作。但是,该过程需要为每个视频段传输一个模型,从而导致额外的带宽成本。所以该研究提出了一种压缩方法,利用 CaFM 模块结合联合训练的方式,将模型参数压缩为原本的 1%。
  动机和发现
  图 2
  该研究将视频分成 n 段,并相应地为这些视频段训练 n 个 SR 模型 S1、S2 ...Sn。然后通过一张随机选择的输入图片(DIV2K) 来分析 S1、S2...Sn 模型间的关系。该研究在图 2 中可视化了 3 个 SR 模型的特征图。每张图像代表某个通道( channel)的特征图,为了简单起见,该研究只可视化了一层 SR 模型。具体来说,该研究将特征图表示为
  ,其中 i 表示第 i 个模型,j 表示第 j 个 通道,k 表示 SR 模型 的第 k 层卷积。对于随机选择的图像,可以计算
  和
  之间的余弦距离,来衡量这两组特征图之间的相似度。对于图 2 中的特征图,该研究计算了
  ,
  和
  之间的余弦距离矩阵。如图 3 所示,研究者观察到虽然 S1 , S2 ...Sn 是在不同的视频段上训练的,但根据图 3 中矩阵的对角线值可以看出"对应通道之间的余弦距离非常小"。该研究计算了 S1、S2 和 S3 之间所有层的余弦距离的平均值,结果分别约为 0.16 和 0.04。这表明虽然在不同视频段上训练得到了不同的 SR 模型,但是
  和
  之间的关系可以通过线性函数近似建模。这也是该研究提出 CaFM 模块的动机。
  图 3
  内容感知特征调制模块(CaFM)
  该研究将内容感知特征调制 (CaFM) 模块引入基线模型(EDSR),以私有化每个视频段的 SR 模型。整体框架如图 4 所示。正如上文动机中提到的,CaFM 的目的是操纵特征图并使模型去拟合不同的视频段。因此,不同段的模型可以共享大部分参数。该研究将 CaFM 表示为 channel-wise 线性函数:
  其中 x_j 是第 j 个输入特征图,C 是特征通道的数量,a_j 和 b_j 分别是 channel-wise 的缩放和偏置参数。该研究添加 CaFM 来调制基线模型的每个卷积层的输出特征。以 EDSR 为例,CaFM 的参数约占 EDSR 的 0.6%。因此,对于具有 n 个段的视频,可以将模型的大小从 n 个 EDSR 减少到 1 个共享 EDSR 和 n 个私有 CaFM 模块。因此,与基线方法相比,该方法可以显著降低带宽和存储成本。
  图 4
  联合训练
  正如上文中所介绍的,该研究可以利用 CaFM 去替换每个视频段的 SR 模型。但是通过在一个 SR 模型上微调n 个 CaFM 模块的方式很难将精度提升到直接训练 n 个 SR 模型的 PSNR。因此该研究提出了一种联合训练的框架,该框架可以同时训练 n 个视频段。公式可以表示为:
  对于 SR 图片
  ,i 表示第 i 个视频段,s 表示该视频段中的第 s 个 sample。公式中 W_s 表示共享的参数,W_i 表示每个视频段私有的参数。对于每个视频段,可以这样计算损失函数:
  在训练过程中,该研究从视频段中统一采样图像来构建训练数据。所有图像用于更新共享参数 W_s,而第 i 个视频段的图像用于更新相应的 CaFM 参数 W_i。
  VSD4K 数据集
  Vimeo-90K 和 REDS 等公共视频超分数据集仅包含相邻帧序列(时常太短),不适用于视频传输任务。因此,该研究收集了多个 4K 视频来模拟实际的视频传输场景。该研究使用标准的双三次插值来生成低分辨率视频。研究者选择了六个流行的视频类别来构建 VSD4K,其中包括: 游戏、vlog、采访、体育竞技、舞蹈、城市风景等。每个类别由不同的视频长度组成,包括:15 秒、30 秒、45 秒、1 分钟、2 分钟、5 分钟等。VSD4K 数据集的详细信息可在论文的 Appendix 中阅读,同时 VSD4K 数据集已在github项目中公开。
  定性 & 定量分析
  主实验对比
  根据上表可以清晰地看到,在不同的视频和超分尺度上该方法 (Ours) 不仅可以追赶上训练 n 个模型 (S1-n) 的精度,并且可以在峰值信噪比上实现精度超越。注:M0 表示不对长视频进行分段,在整段视频上只训练一个模型。
  VS codec
  该部分实验对本文提出的方法和传统 codec 方法 (调低码率做压缩) 进行了定量比较。根据上表可以清晰地看到 (红色表示第一名,蓝色表示第二名),在相同的传输大小下(Storage),该方法(Ours) 在大多数情况下可以超越 H264 和 H265。同时视频的长度越长,SR 模型所占传输大小的比例越小,该方法的优势越明显。
  定性比较
  总体而言,该论文创新性地利用超分辩率算法定义网络视频传输任务,目的是减少网络视频传输的带宽压力。利用内容感知特征调制 (CaFM) 模块结合联合训练的方式,对每个视频段对应的模型参数量进行压缩(1%)。为后续的研究者,提供了新的研究方向。

心理学家揭示为什么我们接吻时会闭上眼睛在最长的接吻世界历时583558。虽然我们不知道这对夫妇是如何坚持了这么久,但我们都有一个十分疑惑的问题,我们都曾在某个时候问过自己接吻时为什么要闭上眼睛?我们确定了接吻时闭眼的原更多破纪录的热浪即将到来更长达一周的破纪录热浪正在向我们袭来。根据一项新的研究,从现在到2050年,如果温室气体排放量居高不下,这种热浪发生的几率是过去几十年的2到7倍研究。从2051年到2080年,这些抛弃谷歌,华为获得一项关键技术授权,预计将收获更多海外用户一近日,据福布斯新闻网报道,华为目前正在经历着很棒的一周。根据早先的报道,华为目前获得一项关键技术的授权,从而在被Google封杀的情况下为其手机获得了一项新的服务授权。据悉,授权背影负重前行,这不该是父亲的形象一般人对父母角色的认知是随着年龄的增长而逐渐深入的,尤其是父亲这个角色。在童年,父亲是个超人,无所不能到少年,父亲跟孩子的矛盾会随着叛逆期的到来而逐渐凸显到高中大学阶段,父亲在子女面对大多数,你能做到不成为乌合之众吗?国王的新衣这个故事大家都知道吧。那为什么只有一个孩子诚实地提出了疑问,而其他人都选择假装看得见国王的新衣呢?真的只是诚实问题吗?在心理研究中,也有一个类似国王的新衣的心理实验。所罗我国排名前十位的岛屿截止目前,我国领土面积960万平方公里,海洋领土实际控制面积299。7万平方公里,合计1259。7万平方公里。我国海岸线长度3。2万千米,大陆海岸线北起辽宁省的鸭绿江口南至广西壮族你能主宰自己的命运吗?这和你的人格特质有关当有好事发生,你认为是你实至名归,还是运气使然?如果有坏事发生,你会认为这是你的失误,还是其他原因造成的?1966年,心理学家朱利安。罗特提出控制点理论,他认为人们在对行为结果归因气候极端七下八上时间未到,为什么今年华北地区降水这么多?中央气象台升级发布暴雨黄色预警。重点关注京津冀地区,降水极端性较强,且对周一早高峰会有较大影响。其中,北京天津石家庄等地将迎今年入汛以来最强降雨过程,过程雨量达暴雨到大暴雨。12日王坡页岩竟然是火山喷发形成的在地质学的基础研究中为了区分不同的岩石地层,地质学家通常会给它们起一个名字,大部分情况下是以第一次发现它的地方命名,比如这次要讲的王坡页岩就是这样命名的。王坡页岩,顾名思义就是在王莫要小瞧古人的智慧,中国古代曾领先世界万年中国古代的科学理论在当今时代,人们理解的大部分科学其实是西方工业革命的以后的产物,比如物理化学等等,其实在中国古代和西方的古代,这些并不是主流的科学研究方向,都只是给主流科学打辅助中国大地构造基本轮廓对亚洲古板块进行划分中,中国大陆可划分为塔里木中朝板块,华南及东南亚板块中国大陆北面是西伯利亚板块,哈萨克斯坦板块西南面是印度板块东面是太平洋板块和菲律宾板块。中国大地构造的发展主
南北两极同时出现极端高温地球要化了吗?前言多名气象学家观测发现,南北两极部分地区近日出现极端高温天气,有的比正常温度高出三四十摄氏度。南北两极同时出现极端高温是怎么回事?地球要化了吗?南极洲多个考察站本月(3月)18日宇宙红移现象宇宙红移现象,在物理学和天文学领域。指物体的电磁辐射,由于某种原因波长增加的现象。在可见光波段,表现为光谱的谱线,朝红端移动了一段距离。即波长变长,频率降低。红移的现象目前多用于,NASA人类发现的系外行星已超五千颗中新社旧金山3月22日电美国国家航空航天局(NASA)当地时间21日称,该机构的系外行星档案当天新增65颗系外行星,人类发现的系外行星总数随之突破5000颗大关。美国国家航空航天局新研究称宇宙是个双胞胎,另一个是反宇宙,那里的时间会倒流宇宙被认为起源于一次大爆炸,大爆炸就是宇宙的时间与空间的起点,之后时间线不断延伸,空间不断变大,宇宙间的各种事物也都在不断变化,这一切都是不可逆的,这些也都是基本常识。然而美国趣味地球自转变快,一天已不足24小时,未来只会越来越慢?时间面前人人平等,一天对任何人来说都是24小时在过去相当长一段时间内,这两句话都是无比正确的,然而随着科学测量精度的进步,尤其是对地球基本情况的了解,科学家开始发现地球的自转速度并重压激光,科学家发现新型冰物理学家在钻石砧槽中开创了一种新的激光加热技术,从而发现一种新型冰。图片来源ChrisHiggins你放入饮料中的冰的官方名称是IceI,实际上冰一直排列到了IceXIX。人们已知ASC科研发现超级计算机揭示了夏威夷皇帝的海底之谜夏威夷皇帝海山链从夏威夷群岛到北太平洋的底特律海山横跨近四千英里,呈L形,先向西,然后突然向北。自从1940年代从众多回声测深船的数据中首次发现以来,大部分海底山脉和火山岛的60度南极海冰面积创最小纪录,对生态气候有何影响?交汇点讯最新观测数据和综合分析显示,今年2月,南极海冰面积创下1979年有卫星观测以来最小面积纪录,为192万平方公里,比测量于2017年的目前第二小海冰面积少了19万平方公里。南价比钻石的珍宝铼到底是什么?为何说航空工业发展取决于它1870年,化学家门捷列夫在发布元素周期表时,预测了一种神奇的元素。1914年,英国物理学家亨利莫塞莱推算出这种元素的一些数据。直到1925年,奥托伯格在铂矿铌铁矿中探测到这种元素遥感科学国家重点实验室2022年度开放研究基金申请指南一实验室简介遥感科学国家重点实验室依托中国科学院空天信息创新研究院北京师范大学,坚持以面向地球系统前沿科学问题和社会可持续发展的国家重大战略需求为导向,以科学理论和技术的原始创新为氧气会被耗尽吗?保护自然环境,节能减排氧气会耗尽吗?氧气占空气含量的21。植物动物和我们人类每天都呼吸空气中的氧气并释放二氧化碳。据美国世界观察研究所发布的一份报告显示,100年前,世界每年进入大气的二氧化碳仅为960