目标检测堪比人眼多模态融合技术蒸蒸日上,自动驾驶将更加先进
引言
随着新一轮科技革命正在如火如荼的进行着,为响应国家发展需求、更好地在国际竞争中取得优势,中国政府先后提出了"中国制造2025"和"互联网+"发展战略,强调经济转型至高质量发展。
作为国民经济中的支柱产业,汽车行业的发展表现一向被大众期待,汽车行业的转型也是新一轮科技革命中的重点所在。
同时,随着互联网技术的迅猛发展和卫星定位对高精度地图的绘制不断普及,自动驾驶成为一种可能,自动驾驶技术也备受关注。
说起自动驾驶技术,顾名思义自然就是不需要人坐在驾驶座上汽车就可以自动行进,因此自动驾驶汽车又被称作自动驾驶汽车、电脑驾驶汽车、轮式移动机器人。
很多人会好奇如果没有人驾驶车子该怎么识别环境呢?不会很容易发生事故吗?但事实上因为有了自动驾驶技术,交通问题得以缓解,社会科技也更加进步。
自动驾驶技术主要依靠的是深度神经网络、传感器技术等人工智能技术,通过电脑系统进行一个判断和驾驶。
自动驾驶技术在因减少交通堵塞及交通事故发生备受好评的同时,其真正实行过程中仍需要解决不少的问题,目标检测技术便是其中不容忽视的一项。目标检测技术是自动驾驶汽车稳定进行工作的重要前提和保障,其是一种基于目标集合和统计特征的图像分割。
本文将较为具体的介绍自动驾驶技术中的目标检测,以及其中的数据融合方法。进一步探索我国自动驾驶技术的发展策略和应用前景。 一.了解目标检测的相关知识,相关技术不断先进化以减少漏洞
首先从整体自动驾驶汽车的目标检测系统上看,我们可以将可以进行目标检测的自动驾驶汽车看成一个个模型。
前面已经谈及过了目标检测的大致定义,即是一种基于目标集合和统计特征的图像分割。根据定义,通常要求目标检测算法先在图像上搜索出可能包含目标的区域,再在此区域上进行分类,这种模型是多阶段模型。
多阶段模型是将一个检测过程划分为若干个步骤分步进行,这样下来虽然好像听上去更加细致实,则非常严重的减缓了检测速度,随着相关学者进一步探索,可以在监测的同时进行分类的单步检测模型被提出,大大提高了检测速度。
接下来谈谈自动驾驶汽车目标检测技术的具体方法,不同模型状态下所用的方法必然存在一定的差异。但是一般自动驾驶汽车上都会应用相同的一些传感器,如激光雷达、雷达、深度相机等。
因此自动驾驶中同样需要关注基于点云、深度图像或其他模态数据的方法,其中点云由激光雷达或雷达提供。
近年来,自动驾驶技术中不断有新的目标检测方法被提出,但大部分模型还是基于图像,总体上已经达到了一个不错的水平。
但在具体一些特殊场景,如行驶环境极其恶劣复杂的情况下,交通事故是很容易发生的。而自动驾驶汽车又缺少了人对路途的判断,所以对于目标检测的准确性有了更高的要求。
但遗憾的是,不得不承认我国目前面对这些特殊情况下已有的模型性能仍然存在不足之处,不能完全规避所有风险。
曝光不足又或者曝光过度、网络对目标分辨率低、拍摄图像单一等问题时有发生......
有关技术人员根据多次问题总结出了一定经验,并针对具体情况研究出了相应的解决方案,达到了一定的缓解效果。如当自动驾驶汽车在路面上行驶的时候,很容易遇上光照变化幅度较大的区域,导致相机的记录失真,这将严重影响自动驾驶汽车的决策。
为此,研究者考虑在视频流中利用连续帧的信息进行目标检测,而另一主流研究方向则是利用多种传感器提供的多模态数据进行信息融合,再进行目标检测,两者都达到了各自相应的效果。
可以确定的是,目标检测技术的核心是通过各种算法来完成分析检测任务的,而自动驾驶汽车的算法又是基于各种传感器进行运作。
如果算法只是基于单一的传感器的话,即使在一些车道线检测这种比较基础的任务上都很难完美表现。
而多传感器不仅能够提高传感的效率,获取对外界和车辆本身更全面更客观的信息,还能够自动在消息互补中有效提高自动驾驶的安全性和可信赖性,可以说是目前最好的选择。
因此,相关专家试图通过融合多模态数据来充分挖掘考察信息,并最终提高目标检测和其他自动驾驶模型的相关性能。
将在多传感器的算法进行下得到的多模态数据进行整合互补,就是所谓的"多模态数据整合"。
而又如何理解与利用这多种模态数据之间的关联与互补之处呢?为了探索多模态数据融合在应用中的这个重要问题,接下来让我们具体了解一下多模态数据融合吧! 二.探索多模态数据融合技术,感悟其优势与相应的模式与方法
自动驾驶汽车中多模态数据融合后,可以对所有信息有一个整体的整合判断,其中不明显之处自然会有其他算法下得到的一个结果进行补充说明。
举个例子,不同的车载传感器既可以提供对同一环境的感知信息,如对前方道路的 RGB 图像、热成像、深度图像、激光雷达点云和雷达点云等,也可以提供对汽车自身的感知信息,如车辆的行驶速度、路径等,为连续地感知环境提供重要的估计参数。
这些信息整合后会形成一个最为精确的结果,由系统传输至自动驾驶汽车的执行部分,由此进行工作。
有如此一个好处,自动驾驶中的数据融合应用必然是很广泛的。其在多个任务中都可以发挥作用,比如目标检测 、目标跟踪和即时定位与建图等。
多模态数据融合技术中最常见的融合模式是激光雷达与 RGB 相机的融合:激光雷达点云可以主动感知较大范围内的物体,因此不受光照条件的影响,而 RGB 图像所提供的色彩、纹理等视觉信息则可以被用于更高精度的视觉任务。
但这种融合模式也存在一定的局限性,如多个传感器会有失灵、配准不协调等情况,这也是后续需要继续研究改善的。
然后是多模态数据融合技术的具体融合方法,也相当于是多模态目标检测的具体方法分类,主要分成三大类:基于RGB图像、基于激光雷达点云、基于 RGB-D 图像和多光谱图像。
第一种方法,有关RGB,在这里具体做一个说明。RGB是对应红色、绿色、蓝色三种颜色英文的首字母,这三种颜色结合在一起,可以通过叠加的不同得到几乎所有颜色,因此该色彩模式目前被运用的很广泛,可以说是工业界的一种颜色标准。
多模态数据融合技术可以基于RGB图像进行数据的融合也就有了合理性。
第二种基于激光雷达点云的融合方法凭借其独特的优势——主动感知的特性、可提供更密集的点云,目前相较于其他两种方法应用的更为广泛。
据有关数据研究调查显示,激光雷达的感知范围非常宽泛,扫描半径可达至五十到七十米甚至更远。
不仅如此,其环境光照对其的影响非常小,很好的缓解了前面说到的环境恶劣复杂情况所带来的问题,也可以良好地提供环境的深度信息和反射率。
还有一点值得一提,激光雷达数据为三维点云格式,因此点云的坐标自然地提供了物体相对激光雷达的三维空间坐标,可以用于三维空间的目标检测。
而点云的反射强度值反映了物体表面的材质,因此不同的物体可以根据反射强度被很容易地区分开。
除了可以执行这样的三维检测任务,点云更是计算二维平面图像的一把"好手"。将三维检测所得的信息投影到二维平面上,环境的深度、反射率和物体高度等信息就显而易见了。
第三种基于RGB-D 图像和多光谱图像中也有个RGB,有人猜测是否与第一种融合方法有所关联,答案显然是的。
深度相机,又称 RGB-D 相机,在 RGB 图像的对应像素上提供了深度信息,从而让所提供的RGB-D 图像在一定程度上结合了 RGB 图像和激光雷达的优点,计算上较前两种方法更为简便。
多光谱图像与深度图像类似,其基于物体表面温度的热成像的特性可以避免环境可见光源对成像的影响,从而可以在包括夜间的多种环境下获得具有区分度的图像。总体看来第三种融合方法好处较多,优势明显。 三.分析多模态数据融合的计算方法,了解其合理性
多模态数据融合的计算方法和融合方法都是多元的,主要可以归为连接法、合并法、
相加法、子网络法和辅助估计法 5 种。其中连接法最为直接,是将不同模态的数据或其特征图相连接,特征的增加直接体现在数据或特征图的维数增加上。
合并法则是将属于同类的元素信息进行归类合并,采用"加权求和"的形式,从而对所得结果进行探究。其他三种方法目前运用的较少,内容复杂难懂,暂时不做讲解。
从融合方法、模型鲁棒性(即模型的安全稳定方面)、数据冗余分析上,相关学者对于多模型数据融合技术进行了一个系统的分析。
经过探究发现,中间融合 (对应本文所述特征融合) 得到了最佳结果,并且较晚的融合比较早的融合和过于晚的融合更佳,而对于最佳融合阶段,目前还没有研究给出相关估计。
与单一模态模型比较看来,多模态模型的安全性更有保障。而关于数据冗余性的探究上,目前并没有发现由于融合数据过分冗余造成严重的影响,相反较多的数据使得模型性能有所提升。
结语
为了进一步提高目标检测的一个准确性,相关学者付出了很多的精力去研究,也有了一定的成果。具体体现在深度学习技术和计算机视觉领域的发展已经促进目标检测技术取得了显著的进步,尤其是基于图像的目标检测技术水平得到了大幅提升。
但是自动驾驶应用场景并不如想象中那么稳定,而是始终复杂多变,这也对保持目标检测的准确性提出了新的挑战。
基于此,我国的相关学者应根据目前已知存有的问题进行改进,并对未知的可能存在的问题进行进一步探究。相信在不久的将来,我国的自动驾驶技术一定会实现很大的进步。
参考资料:
《自动驾驶》
《自动驾驶汽车》
《目标检测技术》
《Automotive Innovation》
小萨博尼斯近10战场均20。3分15。1板7。1助,命中率69。7国王主场134120战胜湖人,全场比赛国王前锋多曼塔斯萨博尼斯首发出战37分钟,8投4中,三分球2投1中,罚球4罚4中得到13分21篮板12助攻1抢断。最近10场比赛里,小萨博尼斯
勇士惨败篮网创造尴尬记录?莫兰特心比天高,西部最新排名出炉孟菲斯当家球星莫兰特再一次展示何谓心高气傲心比天高。近日他在接受女记者MalikaAndrews采访时自信说道灰熊纵观西部无一对手,而全联盟也只有凯尔特人值得灰熊学习。换言之,在莫
快报皇马有意10亿欧元签约姆巴佩太阳报皇家马德里准备花费近10亿欧元(约合8。77亿英镑)签下姆巴佩(KylianMbappe),其中包括近5。52亿英镑的工资和约1。32亿英镑的转会费,以及签约费和佣金。据报道
梅西在中国申请梅西商标,被驳回!再次恭喜阿根廷,恭喜梅西!编辑玄袂精诚团结的潘帕斯雄鹰,围绕着当世足坛第一人梅西,历经艰辛拿到了阔别36年的世界杯冠军,精彩,壮阔,荡气回肠!多了这一份世界杯冠军的团体荣誉拼图,荣
WinPE如何创建快捷方式头条创作挑战赛首先说明,这是一个非常基础非常简单的教程,对WinPE有一定基础的朋友可以略过。本教程适合入门新手。WinPE要发挥作用,集成的软件很重要。但是WinPE和普通系统有
国家级精品项目!好消息!千岛湖啤酒小镇入选2022中国体育旅游精品项目千岛湖啤酒小镇千岛湖啤酒小镇是一家具有典型欧式建筑风格的AAA级景区,于2017年正式对外营业。啤酒小镇以啤酒文化为主题,有啤
入驻苏州仁恒仓街,MaisonMargiela如何深化在中国市场的布局?MaisonMargiela限时精品店亮相苏州仁恒仓街。图片来源MaisonMargiela近日,OTB集团旗下高级定制时装品牌MaisonMargiela在苏州仁恒仓街呈现限时精
三星折叠屏还是一哥?从外观到体验,国产品牌有话说!要说智能手机行业最具创新潜力的手机形态是哪一种,就不得不提到折叠屏手机了,三星起初凭借柔性屏供应链方面的优势,一度成为折叠屏手机的元老品牌,旗下的折叠屏手机数量和品类都不少。而在近
DNS协议分析上一篇文章从工作原理角度分析了DNS的作用与意义,这次来看看DNS到底是以什么形式进行通信的。DNS报文格式如下所示DNS报文由12字节长的首部和4个长度可变的字段组成。1。标识,
智能手表有必要买吗?在进羊圈之前,OPPO手表做了关键提醒这两年,电子消费领域发生了巨大的变化。除了手机之外,智能可穿戴智能家居智能出行等相关产品,也越来越受到用户的青睐。更多形式的跨端协作,正在向真正的万物互联进化。不过,根据IDC的相
京东的2022盈利全靠省,未来要靠一张王牌?前言2022年,对新经济互联网行业来说仍然是不平凡的一年。许多风口破灭,许多企业倒下,屹立于食物链顶端的大厂们日子也没有从前好过。正因为今年发生的变化太多动荡太大,年终岁末及时梳理