范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

用于精确目标检测的多网格冗余边界框标注

  关注并星标
  从此不迷路 计算机视觉研究院
  公众号ID |ComputerVisionGzq
  论文地址: https://arxiv.org/pdf/2201.01857.pdf 计算机视觉研究院专栏
  作者:Edison_G  现在 领先的目标检测器是 从基于深度 CNN 的主干分类器网络重新调整用途的两级或 单 级网络。
  一、 前言
  现在领先的目标检测器是从基于深度CNN的主干分类器网络重新调整用途的两级或单级网络。YOLOv3就是这样一种众所周知的最先进的单级检测器,它接收输入图像并将其划分为大小相等的网格矩阵。具有目标中心的网格单元负责检测特定目标。
  今天分享的,就是提出了一种 新的数学方法 ,该方法为每个目标分配多个网格,以实现精确的tight-fit边界框预测。研究者还提出了一种 有效的离线复制粘贴数据增强来进行目标检测 。新提出的方法显着优于一些当前最先进的目标检测器,并有望获得更好的性能。
  二、背景
  目标检测网络旨在使用紧密匹配的矩形边界框在图像上定位对象并正确标记它。如今,有两种不同的方法可以实现这一目的。第一个也是性能方面,最主要的方法是两阶段目标检测,最好的代表RCNN及其衍生物[ Faster r-cnn: Towards real-time object detection with region proposal networks ]、[ Fast r-cnn ]。相比之下,第二组目标检测实现因其出色的检测速度和轻量级而广为人知,被称为单阶段网络,代表性示例为[ You only look once: Unified, real-time object detection ]、[ Ssd: Single shot multibox detector ]、[ Focal loss for dense object detection ]。两阶段网络依赖于一个潜在的区域建议网络,该网络生成可能包含感兴趣对象的图像的候选区域,第二个检测头处理分类和边界框回归。在单阶段目标检测中,检测是一个单一的、完全统一的回归问题,它在一个完整的前向传递中同时处理分类和定位。因此,通常,单阶段网络更轻、更快且易于实现。
  今天的研究依然是坚持YOLO的方法,特别是YOLOv3,并提出了一种简单的hack,可以同时使多个网格单元预测目标坐标、类别和目标置信度。每个对象的多网格单元分配背后的基本理论是通过强制多个单元在同一对象上工作来增加预测紧密拟合边界框的可能性。
  多网格分配的一些优点包括:
  (a)为目标检测器提供它正在检测的对象的多视角视图,而不是仅依靠一个网格单元来预测对象的类别和坐标;
  (b ) 较少随机和不稳定的边界框预测,这意味着高精度和召回率,因为附近的网格单元被训练来预测相同的目标类别和坐标;
  (c) 减少具有感兴趣对象的网格单元与没有感兴趣对象的网格之间的不平衡。
  此外,由于多网格分配是对现有参数的数学利用,并且不需要额外的关键点池化层和后处理来将关键点重新组合到其对应的目标,如CenterNet和CornerNet,可以说它是一个更实现无锚或基于关键点的目标检测器试图实现的自然方式。除了多网格冗余注释,研究者还引入了一种新的基于离线复制粘贴的数据增强技术,用于准确的目标检测。
  三、MULTI-GRID ASSIGNMENT
  上图包含三个目标,即狗、自行车和汽车。为简洁起见,我们将解释我们在一个对象上的多网格分配。上图显示了三个对象的边界框,其中包含更多关于狗的边界框的细节。下图显示了上图的缩小区域,重点是狗的边界框中心。包含狗边界框中心的网格单元的左上角坐标用数字0标记,而包含中心的网格周围的其他八个网格单元的标签从1到8。
  到目前为止,我已经解释了包含目标边界框中心的网格如何注释目标的基本事实。这种对每个对象仅一个网格单元的依赖来完成预测类别的困难工作和精确的tight-fit边界框引发了许多问题,例如:
  (a)正负网格之间的巨大不平衡,即有和没有对象中心的网格坐标
  (b)缓慢的边界框收敛到GT
  (c)缺乏要预测的对象的多视角(角度)视图。
  所以这里要问的一个自然问题是," 显然,大多数对象包含一个以上网格单元的区域,因此是否有一种简单的数学方法来分配更多这些网格单元来尝试预测对象的类别和坐标连同中心网格单元? "。这样做的一些优点是(a)减少不平衡,(b)更快的训练以收敛到边界框,因为现在多个网格单元同时针对同一个对象,(c)增加预测tight-fit 边界框的机会(d) 为YOLOv3等基于网格的检测器提供 多视角视图 ,而不是对象的单点视图。新提出的多重网格分配试图回答上述问题。
  Ground-truth encoding  四、训练
  A. The Detection Network: MultiGridDet
  MultiGridDet是一个目标检测网络,通过从YOLOv3中删除六个darknet卷积块来使其更轻、更快。一个卷积块有一个Conv2D+Batch Normalization+LeakyRelu。移除的块不是来自分类主干,即Darknet53。相反,将它们从三个多尺度检测输出网络或头中删除,每个输出网络两个。尽管通常深度网络表现良好,但太深的网络也往往会快速过度拟合或大幅降低网络速度。
  B. The Loss function
  Coordinate activation function plot with different β values
  C. Data Augmentation
  离线复制粘贴人工训练图像合成工作如下:首先,使用简单的图像搜索脚本,使用地标、雨、森林等关键字从谷歌图像下载数千张背景无对象图像,即没有我们感兴趣的对象的图像。然后,我们从整个训练数据集的随机q个图像中迭代地选择p个对象及其边界框。然后,我们生成使用它们的索引作为ID选择的p个边界框的所有可能组合。从组合集合中,我们选择满足以下两个条件的边界框子集:
  if arranged in some random order side by side, they must fit within a given target background image area
  and should efficiently utilize the background image space in its entirety or at least most part of it without the objects overlap. 五、实验及可视化
  Pascal VOC 2007上的性能比较
  coco数据集上的性能比较
  从图中可以看出,第一行显示了六个输入图像,而第二行显示了网络在非极大抑制(NMS)之前的预测,最后一行显示了MultiGridDet在NMS之后对输入图像的最终边界框预测。 © The Ending
  转载请联系本公众号获得授权 计算机视觉研究院学习群等你加入!
  计算机视觉研究院 主要涉及 深度学习 领域,主要致力于 人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等 研究方向。研究院 接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重" 研究  "。之后我们会针对相应领域分享实践过程,让大家真正体会 摆脱理论 的真实场景,培养爱动手编程爱动脑思考的习惯!
  计算机视觉研究院 公众号ID |ComputerVisionGzq

中企17架飞机滞留俄罗斯,资产减记8亿美元,称已不抱希望能收回日前,由中国银行控股的中银航空租赁有限公司发布2022年中期财报,财报显示,该集团上半年业绩由盈转亏,账面减记近8。04亿美元,税后净亏损3。13亿美元,而在去年同期,该集团净利润6元以下的低价低估值高成长个股一览有不少股民喜欢做低价股,很多龙头股也是从几块钱起来的。今天我就综合以下几个维度,筛选了一批有望爆发的低位个股,供大家研究。1低价股价都在6元以下,每逢行情比较弱时,主力资金就喜欢拉麦趣尔垮了半边天斑马消费范建狂飙突进的麦趣尔,突然一脚踩上丙二醇,导致公司乳制品业务岌岌可危。今年上半年,受丙二醇事件影响,公司归母净利润巨亏1。75亿元。随着超过7000万元的巨额罚款落地,公司身价1374亿美元!亚洲首富再换人,同时晋升为全球第3大富豪文十夏亿万富翁是一个光鲜亮丽的群体。他们凭借财富地位和超强的社会影响力,成为了普通人所追捧的明星。据福布斯发布的2022年全球亿万富豪榜显示,今年上榜的亿万富豪人数较2021年减少今天a股为什么再度重挫失守3200点,超4200股下跌?到底怎么了?今天a股开盘集体小幅低开,开盘后权重板块的带动之下,上证指数低开震荡回升,原来是假拉升动作,随后空头开始砸盘各大指数快速掉头向下走,跌幅不断地扩大,直接跌穿3200点,板块和个股同三大利空,A股单边下跌,一大看点,午后或震荡回升周三,A股半日交易,三大股指低开低走,单边下跌。行业板块上看,保险酿酒银行家居用品和旅游领涨,供气供热工业机械电气设备汽车类和矿物制品占据跌幅榜。个股方面,上涨539股,下跌429每日航班熔断日报截止9。13日本篇将针对每日的航班熔断情况为大家更新最新一天的航班熔断资讯,方便大家了解自己航班的运行情况。目前按照民航局新规,开始调整部分航班的最新熔断情况,由于按照每一航班的人数百分比进行熔万科刘肖投资要拿特别好的项目,今年前7月获取21个8月31日,在万科2022年中期业绩发布会上,对于界面新闻提出的投资拿地问题,万科执行副总裁首席运营官刘肖表示,万科上半年拿地坚持量入为出,同时重视获取特别好的项目,特别好的项目首令人惊叹的冰岛航空图片显示了为什么这个国家如此受电影欢迎冲击10W粉丝!左上角点击头像关注,不迷路,好作品陆续呈上图集描述作者Albert每个人都知道冰岛的经典形象,著名的斯科加福斯,黑色的海滩,蓝色的泻湖。你能想到的在最近的一次冰岛之威海卫城片区入选第二批国家级夜间文旅消费集聚区记者从市文化和旅游局获悉,第二批国家级夜间文化和旅游消费集聚区名单日前正式公布,威海卫城片区上榜。威海卫城设立于1398年(明洪武三十一年),为防倭寇侵扰,取威震海疆之意。因绝大部终于盼来这个好消息!缅甸食用油,降价了本周,缅甸食用油指导价格每拽下降了近500缅币。缅甸食用油进口储存销售监管委员会消息,9月5日至11日,仰光市场上,食用油基础指导价为一拽5220缅币,但是本周内的指导价为一拽47
响灿适界观丨营养师揭秘,保护肠道的6个关键点,建议收藏转发肠道肩负着消化营养生物合成生物屏障促进免疫等重任。尤其在促进免疫上,肠道可谓劳苦功高,因为其他免疫器官,如肝脏甲状腺淋巴系统等,都需要肠道提供的营养来生存。从这个意义上说,肠道就是进展拓扑材料大线性正磁电阻的贝利曲率模型与实验验证近十年来,拓扑材料展现出丰富的新奇物理行为,拓宽了人们对凝聚态物理的认识。拓扑材料所具有的线性交叉能带可产生低能激发准粒子,对应于量子场论中的外尔费米子。由于质量为零,外尔费米子具房车旅行第二季沙甸大清真寺聂耳广场离开西山区,告别滇池小精灵,来到玉溪。对于以前玉溪我最熟悉的也就是红塔山香烟了。玉溪市一个音乐文化城,红塔区棋阳路有聂耳音乐广场和聂耳纪念馆,路边一直到晚上十二点之前都可以微信上线流量新入口,这波太猛了这几天,微信做了很多功能上的更新,继微信PC3。8。0版本发布之后,安卓微信又迎来了8。0。30正式版,大多是小功能。不过,值得关注的是,微信最近官宣推出的微信搜索结果广告,支持竞晚清鸦片馆的真实场景男子骨瘦如柴,女子媚态百出,任人摆布自晚清道光年间起,朝廷便为鸦片烟的泛滥成灾而感到苦恼万分。鸦片战争爆发前,向中国大量走私鸦片的西方国家正是英国,从1800年至1840年的40年之中,英国向中国大肆输入了约41万箱长江存储Xtacking3。02022年最具颠覆性的技术之一来源TechInsights长江存储(YMTC)的Xtacking3。0有望成为2022年最具颠覆性的技术之一,TechInsights已经拆除了据报道发现它的TiPlus7100抓住时间窗口推动经济进一步回稳向上央视网消息国家发展改革委11月16日举行11月份新闻发布会,会上表示,目前各地经济正在加快回稳发展,下一步将全面落实疫情要防住经济要稳住发展要安全的要求,高效统筹疫情防控和经济社会最新数据发布!10月份国民经济延续恢复态势本报记者孟珂11月15日,在国务院新闻办新闻发布会上,国家统计局国民经济综合统计司司长付凌晖表示,10月份,国民经济延续恢复态势,工业投资稳定增长,就业物价总体平稳,新动能积蓄增强技术专栏登峰造极27马琳的前三板在塑料球时代还能发挥吗?这是一个全新的技术为主的专栏。以问答的形式。答疑的神秘人物为不愿透露名字的两位前国手(都是资深教练)。他们只想岁月静好,安稳睡大觉,不想出名。黑马君觉得与大家分享这些技术心得,是颇广东与江西交界有座城市,经济虽落后,但房价低气候好适合养老芒果旅行日记广东与江西交界有座低调的城市,GDP排名广东省倒数第三,经济虽然落后,但是风景美水质佳,为香港深圳东莞惠州四座城提供饮用水,而且房价低气候好,适合养老。这座城市就是河源住过就圈粉!这是一座真正的海上精品酒店伊时光荏苒,白云苍狗,世事难料啊!3年前的最后一天,我收到了维京游轮发来的预订合同确认函,但因为众所周知的原因,原计划2020年初的布鲁塞尔米兰12日莱茵河之旅,这一趟计划中的旅行