世界动态:自动驾驶多模态融合感知现状及挑战
导读
多模态融合是感知自动驾驶系统的重要任务。本文将详细阐述基于多模态的自动驾驶感知方法。包括LiDAR 和相机在内的解决对象检测和语义分割任务。
从融合阶段的角度,从数据级、特征级、对象级、不对称融合对现有的方案进行分类。此外,本文提出了本领域的挑战性问题并就潜在的研究机会进行开放式讨论。
(资料图片)
01多模态融合感知的背景
单模态数据的感知存在固有的缺陷,相机数据主要在前视图的较低位置捕获。在更复杂的场景中,物体可能会被遮挡,给物体检测和语义分割带来严峻挑战。
此外,受限于机械结构,激光雷达在不同距离处具有不同的分辨率,并且容易受到大雾和大雨等极端天气的影响。因此LiDAR和相机的互补性使得组合感知方面具有更好的性能。感知任务包括目标检测、语义分割、深度补全和预测等。我们主要关注前两个任务。
02
数据格式
相机提供了丰富的纹理信息的RGB图像。具体来说,对于每个图像像素为 (u, v),它有一个多通道特征向量 F(u,v) = {R, G, B, ...},通常包含相机捕获的红色、蓝色、绿色通道或其他手动设计的特征作为灰度通道。
然而,由于深度信息有限,单目相机难以提取,因此在 3D 空间中直接检测物体相对具有挑战性。因此,许多方案使用双目或立体相机系统通过空间和时间空间来利用附加信息进行3D对象检测,例如深度估计、光流等。
激光雷达使用激光系统扫描环境并生成点云。一般来说,大多数激光雷达的原始数据都是四元数,如(x, y, z, r),其中r代表每个点的反射率。
不同的纹理导致不同的反射率,然而,点的四元数表示存在冗余或速度缺陷。因此,许多研究人员尝试将点云转换为体素或2D投影,然后再将其馈送到下游模块。
一些工作通过将3D空间离散化为3D体素,表示为:
其中每个 xi代表一个特征向量,如:
si代表体素长方体的质心,而vi代表一些基于统计的局部信息。局部密度是由局部体素中3D点的数量定义的。局部偏移量通常定义为点坐标与局部体素质心之间的偏移量。
基于Voxel 的点云表示,与上面提到的基于点的点云表示不同,它极大地减少了非结构化点云的冗余。此外,利用3D稀疏卷积技术,感知任务不仅实现了更快的训练速度,而且还实现了更高的准确度。
一些工作试图将LiDAR数据作为两种常见类型投影到图像空间中,包括相机平面图(CPM)和鸟瞰图(BEV)。通过将每个3D点作为 (x, y, z) 投影到相机坐标系中(u, v),可以获得CPM。由于CPM与相机图像的格式相同,因此可以通过使CPM作为附加通道来自然地融合它们。
然而,由于投影后激光雷达的分辨率较低,CPM中许多像素的特征被破坏了。BEV 映射提供了从上方看场景的高视图。检测和定位任务使用它有两个原因。首先,与安装在挡风玻璃后面的摄像头不同,大多数激光雷达位于车辆顶部,遮挡较少。
其次,所有对象都放置在BEV中的地平面上,模型可以生成预测而不会出现长度和宽度的失真。
03
融合方法
本节将回顾激光雷达相机数据的不同融合方法。从传统分类学的角度来看,所有的多模态数据融合方法都可以很方便地分为三种范式,包括数据级融合(early-fusion)、特征级融合(deep-fusion)和对象级融合(late-fusion)。
数据级融合或早期融合方法通过空间对齐直接融合不同模态的原始传感器数据。特征级融合或深度融合方法关注于特征空间中混合跨模态数据。对象级融合方法结合模型在每个模态中的预测结果并做出最终决策。
04
数据级融合
原始数据通过空间对齐和投影直接融合每种模态数据的方法的一个例子是图4中的模型。将图像分支中的语义特征和原始激光雷达点云融合在一起,从而在目标检测任务中获得更好的性能。
3D激光雷达点云转换为 2D 图像,并利用成熟的 CNN 技术融合图像分支中的特征级表示以实现更好的性能。
05
特征级融合
特征级别融合使用特征提取器分别获取激光雷达点云和相机图像的嵌入表示,并通过一系列下游模块融合两种模态的特征。深度融合有时会以级联方式融合特征这两者都利用了原始和高级语义信息。深度融合的一个例子可以是图5中的模型。
06
对象级融合
后期融合,也称为对象级融合,表示在每种模态中融合不同结果的方法。例如,一些后期融合方法利用来自LiDAR点云分支和相机图像分支的输出,并根据两种模态的结果进行最终预测。
请注意,两个分支应具有与最终结果相同的数据格式,但质量、数量和精度各不相同。后期融合可以看作是一种利用多模态信息优化最终proposal的集成方法。一个例子可以是图6中的模型。
如上所述,利用后期融合来细化每个3D区域proposal的分数,将图像分支中的2Dproposal与LiDAR分支中的3D proposal相结合。此外,对于每个重叠区域,它利用了置信度得分、距离和IoU等统计特征。
07
不对称融合
除了早期融合、深度融合和后期融合之外,一些方法对跨模态分支具有不同的特权。其他方法将两个分支视为看似平等的状态,而不对称融合至少有一个分支占主导地位,而其他分支则提供辅助信息来执行最终任务。
后期融合的一个例子可以是图7中的模型。特别是与后期融合相比,尽管它们可能使用提案具有相同的提取特征,但不对称融合只有一个来自一个分支的提取特征。
这种融合方法是合理的,因为在相机数据上使用卷积神经网络具有出色的性能,该网络过滤了点云中语义上无用的点,提取原始点云中的截锥体以及相应像素的RGB信息,以输出3D边界框的参数。
使用 LiDAR 主干以多视图样式引导2D主干,并实现更高的精度。利用来自LiDAR分支的3D区域提案并重新投影到2D,结合图像特征,输出最终的3D提案。
08挑战与机遇
近年来,用于自动驾驶感知任务的多模态融合方法取得了快速进展,从更高级的特征表示到更复杂的深度学习模型。然而,还有一些悬而未决的问题。总结为以下几个方面:
错位和信息丢失
相机和 LiDAR 的内在和外在差异很大。两种模式中的数据都需要在新的坐标系下重新组织。传统的早期和深度融合方法利用外部校准矩阵将所有LiDAR点直接投影到相应的像素。
然而,这种逐像素对齐不够准确。因此,我们可以看到,除了这种严格的对应关系之外,有时利用周围信息作为补充会产生更好的性能。此外,在输入和特征空间的转换过程中还存在一些其他的信息丢失。
通常,降维操作的投影不可避免地会导致大量信息丢失,例如将3D LiDAR点云映射到BEV 图像中。因此,通过将两种模态数据映射为另一种专为融合而设计的高维表示,未来的工作可以有效地利用原始数据,同时减少信息丢失。
更合理的融合操作
当前的研究工作使用直观的方法来融合跨模态数据,例如连接和元素乘法。这些简单的操作可能无法融合分布差异较大的数据,因此难以弥合两种模态之间的语义差距。
一些工作试图使用更精细的级联结构来融合数据并提高性能。在未来的研究中,双线性映射等机制可以融合具有不同特征的特征。
多源信息权衡
现有的方法缺乏对来自多个维度和来源的信息的有效利用。他们中的大多数都专注于前视图中的单帧多模态数据。结果,其他有意义的信息没有得到充分利用,例如语义、空间和场景上下文信息。
在自动驾驶场景中,许多具有显式语义信息的下游任务可能会极大地提高目标检测任务的性能。例如,车道检测可以直观地为检测车道之间的车辆提供额外帮助,语义分割结果可以提高目标检测性能。
未来的研究可以通过检测车道、红绿灯和标志等各种下游任务,共同构建完整的城市景观场景语义理解框架,以辅助感知任务的执行。
参考
[1] Huang, K., Shi, B., Li, X., Li, X., Huang, S., & Li, Y. (2022). Multi-modal Sensor Fusion for Auto Driving Perception: A Survey.arXiv preprint arXiv:2202.02703.
责任编辑:hnmd003
相关阅读
-
当前快播:国家汽车质量检验检测中心(广西)获得国家认监委整车CCC指定实验室资质
为贯彻实施东城集团党委“活力东城”攻坚克难2 0行动实施方案的工作部署和“书记挂帅”项目,柳州汽车...
2022-10-09 -
当前快播:国家汽车质量检验检测中心(广西)获得国家认监委整车CCC指定实验室资质
为贯彻实施东城集团党委“活力东城”攻坚克难2 0行动实施方案的工作部署和“书记挂帅”项目,柳州汽车...
2022-10-09 -
全球动态:新华全媒+丨“夸父一号”开启太阳探测之旅——我国综合性太阳探测专用卫星看点解析
新华全媒+丨“夸父一号”开启太阳探测之旅——我国综合性太阳探测专用卫星看点解析青海新闻网
2022-10-09 -
焦点消息!北京公积金贷款利率下调 此前贷款将从明年1月1日起执行新利率
此外,记者拨打12329住房公积金热线还了解到,在今年10月1日前办理北京市管首套房住房公积金贷款的购房...
2022-10-09 -
【环球时快讯】招商蛇口:2022年1-9月实现签约销售金额2016.11亿元
10月9日,招商蛇口发布《2022年9月销售及近期购得土地使用权情况简报》。根据公告,2022年9月,公司实现...
2022-10-09 -
【世界速看料】融创西安斥资1.23亿元拿地 楼面单价4251元/平方米
先是有媒体报道,房地产行业的融资出现松动,随后,资金链承压的融创集团开始拿地。10月8日,陕西省西安...
2022-10-09
阅读排行
资讯播报
- 环球今日报丨石家庄新客站地区26...
- 全球热文:ST云城:云南投资控股...
- 全球头条:拿下日本站冠军 维斯...
- 环球热头条丨深圳中塞女排俱乐部...
- 天天热议:“把每个人的气聚在一...
- 即时焦点:嵊州交通投资2.72亿元...
- 当前关注:融资放开!多家大行年...
- 焦点消息!东莞下调首套住房公积...
- 世界速看:海尔智家9月份回购A股...
- 全球快看:江苏吴中经发拟发行3...
- 每日速讯:上海:2021年口岸贸易...
- 讯息:花样年杭州项目上诉被驳回...
- 速读:保利地产25亿元中期票据将...
- 不能办理个人重要性基础信息变更...
- 天天实时:如何获取光谱仪上的测...
- 今日热议:充满电的汽车电池测试
- 环球快播:要进八强 女排今晚须赢球
- 视焦点讯!中国女队八战全胜摘得...
- 世界要闻:东莞新政:首套公积金...
- 世界热讯:下半场十人应战!中国U...
- 全球微资讯!通讯:张本智和“打...
- 世界焦点!楼市,还有4大翻倍机会!
- 今亮点!中国女排主教练蔡斌:李...
- 世界球精选!香港故宫文化博物馆...
- 【世界播资讯】国内外汽车除霜除...
- 【全球快播报】《重庆市自动驾驶...
- 今头条!苗浩夺获得年龄组冠军 ...
- 全球热头条丨“地沟油”变身航空...
- 每日热闻!珠海起价26.58亿元挂牌...
- 【环球快播报】华润置地签约鼎信...
- 每日速读!房企拿地积极了!金额...
- 重磅重启伦敦旗舰店,“全球领先...
- Nobol诺博 | 打造【生命优先】...
- 西屋中央空调丨迈向新征程
- 当前观点:东莞下调首套个人住房...
- 全球时讯:福州恒荣星光荟商业项...
- 龙霸国庆七日鲜食安排,破圈引领...
- 【环球时快讯】蔡斌:失利暂时放...
- 焦点热议:江苏扬州拟出让西区新...
- 焦点观察:U23三人篮球世界杯:...
- 世界视点!上海:到2025年 工业...
- 全球热点!“抢收”遇阻 国庆黄...
- 多元化的露营产品带动了假期露营...
- 经营状况良好扩大业务势头强劲 ...
- 增加的支出由当地筹集安排 山东...
- 全球快消息!杭州下调首套个人住...
- 进口多元国际合作不断深化 我国...
- 全球新消息丨丰盛地产底价2.29亿...
- 政策逐步落实基建投资加快落地 ...
- 消费需求回暖 9月份中国电商物...
- 每日时讯!西安:促进工业有效投...
- 环球观点:济宁等多城首套房贷利...
- 微速讯:国乒女团横扫日本队世乒...
- 当前通讯!王曼昱谈上场后观众误...
- 天天快看:绿城的九月:累计1968...
- 今日最新!国乒女团世乒赛夺冠再...
- 微头条丨世锦赛中国女排0:3不敌...
- 最新快讯!中国乒乓女团在成都第2...
- 播报:上海市商务委:全力稳住商...
- 天天快消息!2022女排世锦赛:中...
- 天天快看点丨世乒赛中国女团夺冠...
- 全球观察:3:0战胜日本队 中国...
- 环球关注:张本智和:乒乓球是我...
- 环球快报:房车生活家:十一期间...
- 天天新资讯:中国乒乓男团3:2险...
- 每日快播:1-9月全国300城住宅用...
- 天天关注:财政部:截至8月末,...
- 世界动态:江苏镇江起价31.16亿元...
- 天天资讯:消息称武汉调整公积金...
- 天天实时:3:2险胜日本队,国乒...
- 环球热议:3:2险胜日本队 中国男...
- 天天观速讯丨深圳国庆黄金周接待...
- 焦点简讯:北京“新工体”外立面...
- 全球观察:电动汽车电机控制工作...
- 每日焦点!杭州下调首套房公积金...
- 环球聚焦:家乡路,宽阔又通畅
- 天天观天下!金华义乌挂牌一宗商...
- 全球最资讯丨@企业、个体户,这...
- 微头条丨“快响利箭”长征十一号...
- 世界观察:德国男团险胜韩国挺进...
- 世界微头条丨中国田径协会加强赛...
- 世界看热讯:DEKRA德凯新增电驱...
- 全球快看:应用SomatXR采集仪进...
- 当前短讯!金融街中心(碳中和)...
- 世界动态:我国科学家发现土卫二...
- 今日热文:杭州亚运会第三轮歌曲...
- 当前消息!在希望的田野上 | ...
- 【全球独家】消费需求回暖 9月...
- 世界消息!机构:国庆假期楼市数...
- 当前快播:成都世乒赛团体赛志愿...
- 热文:卓越集团湾区公司国庆期间...
- 世界热消息:黄石城发集团拟发行...
- 世界今日报丨直击“连环单”痛点...
- 焦点关注:稳增长效应显现 9月...
- 当前快播:9月份中国物流业景气...
- 天天快资讯丨F1日本大奖赛排位赛...
- 当前时讯:【中指快评】2022年1-...
- 天天快报!在希望的田野上 | 果...
- 当前观察:全国自动驾驶路测牌照...
- 天天日报丨乡村新面貌丨美丽乡村...