全图片带你了解ROI一文图解AI之CV系列

　　导言：我一直受惠于很多网络上图文并茂的优秀英文技术文，这些文章不仅便于理解也便于回顾，因为很多时候再次见到图就能回想起当时学会的复杂概念，所谓千言万语不及一张图。MyEncyclopedia公众号会每次一个概念逐渐建立起主流 AI 领域（CV，NLP，RL，GNN）最直观最形象的概念和技术，并整理成知识网。
　　文章首发于 https://mp.weixin.qq.com/s/u39urFx_q0Z9Yb4BNv-ZUQ
　　我们将讨论Fast R-CNN论文（上图中的浅蓝色矩形）中描述的原始 RoI 池化。该过程有第二个和第三个版本，称为RoIAlign和RoIWarp。RoI（感兴趣区域）是什么？
　　RoI （感兴趣区域）是来自原始图像的建议区域。我们不打算描述如何提取这些区域，因为有多种方法可以做到这一点。我们现在唯一应该知道的是有多个这样的区域，最后目标检测算法对所有区域进行分类。  Fast R-CNN 的工作原理是什么？
　　Fast R-CNN 不同于基本的 R-CNN 网络。它只有一个卷积特征提取（在我们的示例中，我们将使用 VGG16）。
　　我们的模型采用大小为 512x512x3 （宽 x 高 x RGB）的图像输入，VGG16 将其映射到 16x16x512 特征图。您可以使用不同的输入大小（通常较小，Keras 中 VGG16 的默认输入大小为 224x224）。
　　如果您查看输出矩阵，您应该注意到它的 宽度 和 高度 正好比输入图像小 32 倍 (512/32 = 16)。这很重要，因为所有 RoI 都必须按此比例缩小。  RoI 举例
　　这里我们有 4 个不同的 RoI。在实际的 Fast R-CNN 中，您可能有数千个，但显示所有数千个将无法显示。
　　重要的是要记住 RoI 不是物体边界框 。它可能看起来像，但它只是进一步处理的提案框。许多人认为这是因为大多数论文和博客文章都在实际对象上创建提案框。这样更方便，我在我的图像上也这样做了。下图中绿色框是一个不在实际对象上的提案示例，它也将由 Fast R-CNN 检查。
　　有一些方法可以限制 RoI 的数量，也许我以后会写到。  如何从feature map中得到RoI？
　　现在，当我们知道 RoI 是什么时，我们必须能够将它们映射到 VGG16 的输出特征图上。
　　每个 RoI 都有它的原始坐标和大小。从现在开始，我们将只关注其中一个：
　　它的原始尺寸为 145x200 ，左上角设置为 (192x296) 。您可能会说，我们无法将这些数字中的大部分除以 32 。  宽度：200/32 = 6.25 身高：145/32 = ~4.53 x: 296/32 = 9.25 和：192/32 = 6
　　只有最后一个数字（左上角的 Y 坐标）才有意义。那是因为我们现在正在处理 16x16 网格，我们只关心整数（更准确地说：自然数）。  特征图上坐标的量化
　　量化 是将输入从大量值（ 如实数 ）限制为离散型（如 整数 ）的过程
　　如果我们将原始的 RoI 放在特征图上，它看起来像这样：
　　我们不能真正在这之上应用池化层，因为一些＂单元格＂被分割了。量化所做的是在将每个结果放入矩阵之前对其进行四舍五入。 9.25 变成 9 ， 4.53 变成 4 ，等等。
　　您会注意到我们刚刚丢失了一些图像数据（深蓝色）并获得了新数据（绿色）：
　　因为它仍然可以工作，我们不必处理它，但有一个称为 RoIAlign 的版本可以解决这个问题。  RoI池化
　　现在，当我们将 RoI 映射到特征图上时，我们可以应用池化。为了方便起见，我们将再次选择 RoI Pooling 层的大小，但请记住大小可能会有所不同。你可能会问＂为什么我们还要应用 RoI Pooling？＂ 这是个好问题。如果你看一下 Fast R-CNN 的原始设计：
　　原始的 Fast R-CNN 架构。资料来源：https://arxiv.org/pdf/1504.08083.pdf
　　在 RoI Pooling Layer 之后是一个固定大小的 全连接层 。因为我们的 RoI 具有不同的大小，所以我们必须将它们合并为相同的大小（在我们的示例中为 3x3x512 ）。此时此刻，我们映射的 RoI 大小为 4x6x512 ，正如您想象的那样，我们 不能将 4 除以 3  。这就是量化再次出现的地方。
　　这次我们不必处理坐标，只需要处理大小。我们很幸运（或者只是池化层的方便大小）6 可以除以 3 得到 2，但是当你将 4 除以 3 时我们剩下 1.33。在应用相同的方法（向下舍入）后，我们得到一个 1x2 向量 。我们的映射看起来像这样：
　　由于量化，我们再次失去了整个底行：
　　现在我们可以将 数据汇集到 3x3x512 矩阵中
　　在这种情况下，我们使用了 最大池 化，但它在您的模型中可能有所不同。这个过程是在整个 RoI 矩阵上完成的，而不仅仅是在最顶层。所以最终结果是这样的：
　　相同的过程应用于原始图像中的每个 RoI，因此最终，我们可能有数百甚至数千个 3x3x512 矩阵。这些矩阵中的每一个都必须通过神经网络的剩下部分（从 FC 层开始）。对于它们中的每一个，模型分别生成 bbox 和类别分别。  接下来是什么？
　　池化完成后，我们限定了输入的大小为 3x3x512 ，因此我们可以将其送入 FC 层进行进一步处理。还有一件事要讨论。由于量化过程，我们丢失了大量数据。准确地说，这么多：
　　这可能是个问题，因为每个＂单元格＂都包含大量数据（特征图上的 1x1x512 在原始图像上松散地转换为 32x32x3，但请不要使用该参考，因为这不是卷积层的工作方式）。有一种方法可以解决这个问题 (RoIAlign)，我很快就会写第二篇关于它的文章。
　　本文原作者 Kemal Erdem，由 MyEncyclopedia公众号翻译，原文链接https://erdem.pl/2020/02/understanding-region-of-interest-ro-i-pooling

共谋发展成都市新都区与驻蓉央企市属国企共话合作机遇封面新闻记者罗田怡参观座谈，这场先走走看看后面对面交流的活动，从13时到19时，进行了6个多小时，主宾都兴致勃勃。3月8日，驻蓉央企和市属国企区县行活动走进成都市新都区，20家在蓉DNF大转移前60版本剧情28奥兰奶奶与辛达的爱情前情提要辛达送冒险家进入密室，帮助冒险家了解一些转职与觉醒的事情，但后面发生的事情超出了辛达的控制，甚至辛达都被影响一度失去了理智，所以辛达只能放手不管，让冒险家自生自灭。正文雷米女性更需要戒糖！点击塔兰特头像加关注不错过千本好书分享今天分享一本久违的好书女性脑。本书是美国大脑健康之父亚蒙博士所著，里面有很多特别靠谱的科学洞察，能帮女性变得更好。比如，我们都知道要少吃糖，那我国作为核电大国，到底拥有多少座核电站？它们主要分布在哪？在阅读此文前，诚邀您点击一下关注，既方便您进行讨论与分享，又可以让您下次继续阅读相关文章，带来不一样的参与感，您的认真阅读是我们最大的动力，感谢您的支持。自1964年，我国原子弹爆几十块耳环怎么戴出几万块的效果？看完这两部剧，你就有新思路了最近又去重温了风吹半夏和狂飙，许半夏的敢拼敢闯，大嫂陈舒婷的优雅干练，这两个角色不仅个人魅力十足，就连穿搭也是妥妥的时尚圣经许半夏和陈舒婷这两个角色气质穿衣风格都十分相似，更是妥妥U20中国女足60露獠牙，男足冲击亚洲杯8强！足坛3个月扫黑见效果从2022年11月到2023年2月，中国足坛的扫黑工作为期3个多月，在足协主席陈戌源落马后，足坛扫黑基本上大结局，可能还会牵扯出小虾米，不过，大鱼基本上没有了。从时间上来看，陈戌源泰山西三十公里处有一牛山，景色不错，传奇挺多东岳泰山西行三十公里，有一座山，名叫牛山，这里地处肥城市西北部，北距济南六十余公里。牛山，听其名给人很牛的感觉，走近它，你会觉得它似乎还真有一点牛的资本。牛山，山清水秀，怪石嶙峋，面试精选！美团大佬带你一周刷完Java面试八股文，比啃书效果好多了2022这抓马的一年终于过去了，疫情的影响可以说越来越小，市场的慢慢复苏，各大企业的招聘也肆无忌惮起来，放眼到IT技术行业，Java又再一次成了需求的大头，各种高薪福利统统奉上。各JavaScript中的String类型模板字面量定义字符串String（字符串）数据类型表示零或多个16位Unicode字符序列。字符串可以使用双引号（）单引号（）或反引号（）标示，因此下面的代码都是合法的letfirstName张三le坚持盐蒸打卡，效果很棒哦！盐蒸有助身体健康坚持盐蒸打卡，效果绝对不会令你失望！盐蒸作为一种健康的养生方式，越来越受到人们的青睐。盐蒸过程中，喜玛拉雅盐蒸所发出的启动波可以与人体细胞产生共振，使人体细胞组织更医院人满为患？应对甲流别恐慌，连花清瘟治疗效果好近日，家住北京通州的李先生，因孩子高烧持续不退，前往医院就诊。没想到儿科急诊已经挂到了300多号，且大多数都是发热症状。家长们纷纷表示，担心孩子感染甲流，一出现症状便赶往医院检查。

<<<<<<－>>>>>>

1894年，孙中山想面见李鸿章，李鸿章说仗打完以后再说1894年，孙中山写完一封长达8000多字的信，把手中的烟摁灭，长舒一口气辛苦这么多天，一定要把它呈现给中堂大人，如果能面见他，就最好不过了。这封信名叫上李鸿章书。孙中山为什么要上石门县夏家巷学区党支部开展缅怀先烈践使命党员教育活动石门县夏家巷学区党支部开展缅怀先烈践使命党员教育活动缅怀先烈守初心，学习党史践使命（文图杨文明陈立峰）清明节前夕，3月22日，蒙泉镇夏家巷学区党支部组织全体党员教师前往红色教育基地白菜之王的悲剧落幕，伊瓦伊洛农民起义之挽歌保加利亚简史27头条创作挑战赛保加利亚历史上的伊瓦伊洛农民起义不仅反封建反剥削，推倒懦弱的沙皇统治，更是一场反侵略反外敌的民族解放战争！成功将入侵保加利亚的蒙古鞑靼人赶出国境，拯救了濒临灭亡的保加第四游击区独立第二支队文宋成泰1938年2月，杨作舟与徐春阳宋宜宏等人组织起一支100多人四五十支枪的队伍。随第四游击区第一支队序列，拟番号第四游击区第二支队。徐春阳任支队长，宋宜宏任副支队长，杨作舟任匈奴人打败月氏，拿月氏王头颅骨做酒杯汉武帝初即位的时候，从北方匈奴投降过来的人都说，匈奴打败了月氏，拿月氏王的头颅骨做成大酒杯，月氏人被赶跑，对匈奴怀着强烈的仇恨。他们想攻打匈奴，但得不到别国的援助。当时，武帝正想消2023最新电视盒子性能排行榜，排行前五的品牌入手绝对不亏写在前面虽说现在电视的寿命普遍较长，但身为家电，用久了就难免迟缓卡顿。然而换台电视少则上千，多则上万，明显不划算。这时候一个电视盒子就能很好的解决这些问题，省钱又省事。但是市面上的文化和旅游部加快城乡道路客运与旅游融合发展交通运输部文化和旅游部近日联合发布关于加快推进城乡道路客运与旅游融合发展有关工作的通知，就提高交通网络衔接效能完善节点设施服务功能丰富旅游出行服务供给等工作作出相关部署。通知提出，空气净化器十大名牌，负离子空气净化器十大品牌哪个好空气净化器十大名牌，冰尊空气净化器排名第一！空气污染对人们造成的直接影响就是健康的损害，尤其是呼吸道的不适。所以越来越多的人们关注空气污染问题，负离子空气净化器产品得到人们关注。那独行侠输球，东契奇数钱手势回击裁判，会受到NBA官方处罚吗？头条创作挑战赛北京时间3月23日，NBA常规赛独行侠对阵勇士，欧文缺阵，最终独行侠2分惜败勇士。比赛结束，东契奇一边走一边对着裁判做出求钱的动作，输球又输人。本赛季全明星赛前，独行韦霍斯特滕哈赫明确称我可以争取首发位置，其他一切都取决于我直播吧3月23日讯对于荷兰前锋韦霍斯特而言，本赛季让自己职业生涯非常重要的赛季。在曼联，他加盟后成为了常规主力球员，在国家队他的出场顺位也得到了提升。在接受荷兰媒体VI采访时，韦霍全国春季游泳锦标赛王长浩刷新男子50米蝶泳全国纪录夺冠新华社青岛3月23日电（记者张武岳高萌）在23日进行的2023年全国春季游泳锦标赛中，王长浩刷新男子50米蝶泳全国纪录，拿下该项目冠军，张雨霏延续前几日的出色表现，摘得女子50米自