范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

CVPR23港科大DABEV3D目标检测新SOTA

  作者丨派派星
  来源丨CVHub
  编辑丨极市平台
  Title : DA-BEV: Depth Aware BEV Transformer for 3D Object Detection
  Paper : https://arxiv.org/pdf/2302.13002v1.pdf  导读
  本文提出了一种 隐式深度学习方法  DA-BEV ,这是一种以环视图像作为输入,在 BEV 视角下利用 Transformer  进行 3D 目标检测的方法。该方法包括两个关键部分:深度感知空间交叉注意力  (Depth-Aware Spatial Cross-Attention , DA-SCA )模块和深度对比学习  (Depth-wise Contrastive Learning , DCL )。DA-SCA 模块负责将深度信息融合至 BEV 特征中,以至于能更好地捕捉目标的深度信息。而 DCL 则通过对正负 BEV 特征进行采样,进一步增强了 BEV 特征的深度感知能力。实验结果表明,DA-BEV 方法在 nuScenes 数据集上取得了 SOTA  检测性能。源码即将开源,敬请期待!  BEV感知
  相当于给自动驾驶开启了"上帝视角",能够让车辆无遮挡的"看清"道路上的实况信息,在BEV视角下统一完成感知和预测任务。  隐式深度学习
  隐性深度学习的主要思想是在 不需要显式定义输出的情况下学习目标函数 。与传统的显式表示方法相比,隐性深度学习不需要人工标注的数据来指定输出,因此可以更好地适应各种复杂的任务和数据类型。 创作背景
  3D 目标检测是自动驾驶和机器人等许多应用中的基本任务。相较于基于激光雷达的方法,基于相机的方法具有成本低、感知范围长、可以识别纯视觉信号(如红绿灯和停止标志)等优势 。但是,相机方法面临的一个关键挑战是缺乏深度信息 。
  前人研究表明,高质量的深度信息能够显著提高 3D 检测性能,因此当前许多研究工作致力于从相机图像中恢复深度信息, 然而,深度估计仍是一个不适定问题 。现有主流研究采用的两种方法,一种是显式深度学习方法 :通过深度估计网络生成伪激光雷达信息,再用激光雷达检测器进行 3D 检测,另一种是隐式深度学习方法 :直接预测三维框而不预测深度。 显示学习方法
  结果提升方法 (Result-lifting)
  将 3D 检测分解为 2D 检测和深度预测,并根据几何特性和约束条件预测对象。
  特征提升方法 (Feature-lifting)
  将图像特征提升到三维空间,通过预测深度图并将其提升到伪激活雷达来模拟激活雷达信号。  隐式学习方法
  DETR3D、BEVFormer、PETR
  使用 目标查询  (object query ) 来探测特征并为每个查询输出预测,而不预测深度。
  本文提出了一种新方法,通过在 空间交叉注意力 (SCA )模块中引入深度信息,同时提出了深度对比学习方法  (DCL ),有效提高了 3D 检测性能。该方法在nuScenes数据集上得到了较好的性能,超过了现有的基准和最先进方法。 方法动机
  图1. 基于 DETR 的 3D 检测器中常见歧义问题
  DA-BEV 的设计动机来自于以往 DETR-based 3D 检测器的常见问题。具体来说,以 BEVFormer 为例,其会将同一光线上的不同 3D 参考点被映射到相同的摄像机参考点上,导致检测头难以确定目标在深度方向上的确切位置,可能导致重复预测。  概述
  图2. 本文方法的训练Pipeline
  本文方法主要解决的是,之前 DETR-based 3D 检测器在处理图像特征时存在的深度信息缺失问题。本方法将深度信息编码到 查询  (query ) 和值  (value ) 中,并提出了一个深度感知的空间交叉注意力模块和一个深度感知的对比学习方法,以增强深度信息的学习和比较。
  DA-BEV 的训练流程分为四个部分,包括 特征提取 、BEV编码器 、深度感知的空间交叉注意力模块 和深度对比学习 ,最后通过 DETR 检测器对 BEV 特征进行预测,得出物体的 3D 边界框和类别信息。 深度感知的空间交叉注意力
  图3. DA-SCA与以往作品中SCA的对比
  在传统的 DETR-based 3D 检测器中, 空间交叉注意力 (SCA )没有考虑深度信息。本文提出了深度感知的空间交叉注意力 (DA-SCA ),通过在查询和值中引入深度编码来解决这一问题。与此前的方法相比,本文的 DA-SCA 采用的是不均匀的深度采样方式,可以更好地提取深度信息。实验结果表明,本文方法可以显著提高目标检测的性能。
  在 DA-SCA中,通过将深度信息包含在位置编码中,将每个像素的深度与其位置信息一起编码。具体地,DA-SCA 采用了 可变形注意力机制 ,使得查询点和值点可以自适应地调整形状,从而更好地适应不同的物体形状。此外,由于 DA-SCA 中的每个查询点都有自己的深度编码,因此可以更好地区分具有不同深度的像素 ,从而使深度信息更好地融入到空间交叉注意力中。 深度对比学习
  深度对比学习 (DCL) 用于鼓励模型学习深度和其在 BEV 特征中的关系。
  DCL 为每个对象分配一个对象射线,然后将其上的点映射到BEV特征上。对于每个对象,从中采样 个 BEV 特征作为正样本,  个作为负样本。对于每个特征,使用其深度值和其在对象线上的 GT 深度值之差来确定其是正样本还是负样本。
  通过将正样本和负样本输入到  box head  和 cls head ,来进行DCL训练。对于正样本,使用对象的 GT 类别进行监督,而对于负样本则使用 "no object"  。此对比损失函数的目的是使预测深度趋近于 GT 深度,并鼓励模型为正样本输出高分类分数,为负样本输出低分类分数。 实验
  表1. 在nuScenes数据集的验证集上对比结果  DA-BEV-S 模型相比于 BEVFormer 模型,在NDS和mAP上分别提升了2.2和1.2个点。
  虽然 BEVDet4D-Based 模型的 NDS 与 DA-BEV 相同,但 GFLOPS 要高得多,并且mAP 低于 DA-BEV。
  表2. 模型可扩展性对比  DA-BEV 的 mAP 比之前的最优模型 BEVDepth 高1.2个点。
  此外,之前的 baseline 模型 BEVFormer 与 DA-BEV: DA-BEV在 mAP 和 NDS 两个指标上分别比 BEVFormer 高出 3.4 和 3.1。 这说明 DA-BEV 可以适应更强的预训练模型,并在各项指标上表现出色。
  表.3 & 表.4 展示了模型的每个组成部分的有效性。
  通过逐步增加不同的组件,模型性能都获得了进一步的提升。
  图4. DA-BEV和基线模型BEVFormer的预测可视化  在图4(b)中,沿深度轴的重复预测被减少了。这个可视化证实了我们的模型可以解决在 动机小节 中提到的歧义问题。
  但是,当两个不同对象的对象光线重叠时,DA-BEV的预测也存在问题。可能存在两个潜在原因导致这个问题。首先,后面的对象被前面的对象遮挡。其次,在我们的 DCL 中,这样深度轴上的两个对象可能会成为彼此的负面例子,导致预测遗漏。  总结
  本文针对之前 DETR-based 的 3D 检测器中 忽略了空间交叉注意力中的深度信息,并在检测物体时产生了严重的模糊问题 进行了研究。为了解决这个问题,本文提出了深度感知的空间交叉注意力 (DA-SCA ) 来编码深度信息,并提出了深度对比学习  (DCL ) 来帮助模型以对比的方式学习深度。实验结果表明,DA-BEV  在不使用额外技巧的情况下取得了显著的改进,并达到了 SOTA 表现。未来,作者计划进一步将这种方法应用到更多检测器中,并研究隐式深度学习与显式深度学习的差异,并尝试将它们结合起来。

如果选择去做地产行业,是做房产中介还是去售楼处做现场销售,大家给点建议?中介的工作很好找!但是想在售楼部做销售就没那么好进了!想在售楼部做置业顾问有两种,第一种代理公司的,这种容易进,但是待遇也好不了多少,低薪低佣,而且来自甲方的压力也不小。另外一种在孩子写作业拖拉怎么办?如果只是单一的做作业拖拉,那应该是学习兴趣不高,如果是做事风格也是如此,请恕我直言,应该家长的做事风格也有拖拉的毛病,家长孩子的第一教师,言行举止潜移默化的影响着孩子的价值观和人生什么食物促进胚胎着床?胚胎着床,是一种生理现象,对繁衍后代有着不可替代的作用。促进胚胎着床的食物有哪些?促进胚胎着床的食物有哪些1胚胎移植后的一两天要注意休息,而运动量就会减少,加上这段时间的心理压力大12岁的女孩可以看言情小说吗?家长需要干涉吗?干涉,好好开导,沉迷于言情,会影响学习的十二岁的女孩正处于青春发育期,对男女的谈情说爱充满了好奇,这是孩子发育期的正常现象,作为家长要正确的引导。首先,旁敲侧击说危害,或者现身说法男人抱怨女人有了孩子忘了他怎么办?回答不少夫妻结婚有了孩子之后,有些女人的关注力注意力爱护力就慢慢转移到孩子身上了,夫妻之间的感情真的大不如从前了。作为丈夫感觉很有失落感啊!为什么会出现这样的情况呢?因为女人怀胎十为何在容妃去世后,康熙追封她为皇后?康熙王朝中的容妃是一个非常独特的女子,竟然敢公然顶撞康熙,但也是因为这一个原因被贬,还要去刷马桶,一直到容妃去世。这里有一个非常奇怪的地方,所有见过容妃刷马桶的人都被康熙下令给容妃王者荣耀肉装后羿太强势,必出反甲,狄仁杰只是弟弟,你怎么看?首先想问大家,后裔可以出反甲吗?其实很显然,所有的英雄包括法师都可以出反甲,只不过大多数玩家都有一个先入为主的概念认为受到职业的影响,不适合出这件装备。首先大家可以看一下反甲的一个你玩的最久的单机游戏是哪款?为玩好这款游戏疯狂的什么程度?有攻略分享吗?小白来回答问题啦!要闻哪款游戏玩的最久小白想了又想,那只有这款古董游戏啦,不知道有哪些小伙伴玩过呢?恩,它就是20年前的一款游戏,文明II啦哈哈,现在已经出到6了呢。文化2是一款结当年被卡特骑扣的中锋弗雷德里克维斯,如今怎么样了?这名法国中锋名叫弗雷德里克维斯,他的生活的确经历了坎坷曲折,但并不是因为卡特的这一死亡之扣弗雷德里克维斯,身高2米18的法国中锋。2000年,由豪华阵容组成的美国梦之队(梦四)征战天水师范兰州交通和甘肃农大哪个学校周围环境比较好?其实三个学校的环境都是差不多的,因为都处在西北地区,都处在一个同样的气候环境当中,相差不是很大,如果是非要区别的话,我个人觉得天水师范的要稍微好一些。因为天水这一座城市比较养人相,工厂里的工艺工程师是做什么的?薪资如何?工艺工程师是制造业公司里的一个技术类岗位,主要负责提升企业产品的工艺水平提升产品的质量,堪称工厂里技术通才,什么都要接触,什么都要懂一点。工艺工程师主要可分成制造工艺工程师和机械工
告别2022的苦味杂陈,迎接2023的苦尽甘来2022是不平凡的一年,有太多难忘的记忆,生活是五味杂陈,给人留下不可磨灭的记忆痕迹。2月份北京成功举办了冬奥会,在艰难的疫情中,国家的精准防控,人民生命至上,给世界上交了一份满意广州队17分哭泣倒下,90分钟绝杀01,郑智15射0中,23败离开中超聚焦中超CBA,独一无二球迷媒体点击右上角关注,不会后悔的尽管争冠与保级悬念均已揭晓,但中超最后一轮仍然有看点,尤其是三支离开顶级联赛的降级队,郑智率领的广州队收官对手是升班马梅州过分!NBA科比妻子与侄子动作亲密形影不离,是肥水不流外人田么NBA巨星科比是人气超高的篮球明星,他在球迷心中的地位甚至不亚于乔丹,而且退役后他在商业领域也有所建树,但是正要他大展拳脚时,他却遭遇了直升机事故,最终将生命定格在了41岁。科比离他们终于对兔子下手了!2022年即将收尾,各大品牌也纷纷发布了新年系列,庆贺即将到来的兔年。一起来看看他们是怎么对兔子下手的!LouisVuitton路易威登趣意融合中国新年生肖动物形象与品牌标志性元素小诗哑巴和疯婆子此文初次写于2020年8月24日,今天大幅度修改光棍哑巴成了村里的大新闻他从大街上捡回一个女人这个女人有点疯傻傻跟着这个男人进了村落日印在土坯墙上斑驳的光圈在墙角晃荡这个如疾风一样遇见我们曾经遇见,可是又怎么样?也许是青葱少年,绕墙小道,无名溪边也许是豆蔻二八,梧桐树下,教学楼前也许是花样年华,春衫浅薄,远近眉眼也许是世事纷杂,雨过天青,怦然翩然也许是觥筹交错,何为死亡?我们面对死亡该何去何从?最近因为某些问题卧床一个星期,那种难受的程度,让我觉得非常痛苦,我在和病毒做都斗争的同时,顺便也在思考着这样一件事,如果我扛不住了,我到时候该会选择如何去死亡呢?说起死亡,我外公因彻底固定下来,永远不要搞研发,永远不要改变彻底固定下来,永远不要搞研发,永远不要改变。锁定一套体系,一个单点,把单点打爆。不要来回乱动,不要左右横跳。固定好了,就疯狂去做执行体系疯狂输出。您不用在意任何人高兴不高兴,您不用三里屯偶遇王冰冰录节目,个子小巧笑容甜美,穿千元棉服接地气近日,有网友在北京三里屯偶遇王冰冰,对方称她本人非常漂亮,应该是在路边拍摄新闻,画面曝光后,迅速引发广泛热议。照片中,王冰冰身穿浅蓝色棉服搭配黑色长裤,脚踩咖色棉衣,一头长发披肩,干皮绝对离不开娇韵诗,会用脸真的会发光!素颜女神养成记恭喜你抓住一枚热爱护肤的小仙女最爱倒腾些瓶瓶罐罐已经成功从黄黑皮转变为黄一白如果你也爱护肤,喜欢素面朝天的自由感请关注我争取每天分享护肤知识!图源网络娇韵诗双萃今年可太火了!让我想日本女星白石麻衣吊带服饰写真,迷人笑容,撩人身材,十分吸睛我们百世麻衣系列照片的一个特点是,她所有的衣服都是吊带衫。虽然有差异,但都显示出她优美的身材。这两张照片是纯白色的麻衣白色吊带裙肖像。我们看到了她迷人的玉背和事业线,还有她治愈的微