全球热文:LaRa:用于多摄像头BEV语义分割的潜表征和光线嵌入
arXiv上传于2022年6月27日的论文“LaRa: Latents and Rays for Multi-Camera Bird’s-Eye-View Semantic Segmentation“,作者来自法国的Valeo.ai 和Inria。
(资料图)
最近在自动驾驶方面的工作广泛采用了BEV语义图作为世界的中间表征。这些BEV地图的在线预测涉及非同一般操作,例如多摄像头数据提取、融合和投影到一个共同顶视网格。这通常需要容易出错的几何操作(例如,单应性或来自单目深度估计的逆投影)或BEV图像像素和像素之间昂贵的直接密集映射(例如,MLP或注意机制)来实现。
这项工作提出“
LaRa
”,一种高效的编码器-解码器,基于transformer的模型,从多个摄像头进行车辆语义分割。该方法用一个交叉注意系统,将多个传感器的信息聚合成一个紧凑但丰富的潜表征集。这些潜表征经过一系列自注意块处理后,在BEV空间通过第二次交叉注意机制重投影。
为了安全规划和驾驶,自动驾驶汽车需要通过多个不同的传感器(例如摄像机、雷达和激光雷达)准确地360度感知和了解其周围环境。大多数方法缓慢地聚合来自每个传感器的独立预测。这种后融合策略在场景级全局推理方面存在局限性,并且没有利用连接传感器的可用先验几何知识。或者,BEV代表性空间,即顶视图占用网格,最近在社区内引起了极大的兴趣。
BEV是一个合适的自然空间,可以融合多个视图或传感器模态,并捕捉语义、几何和动态信息。此外,它是下游驾驶任务的广泛选择,包括运动预测和规划。本文重点研究多摄像机在BEV的感知。BEV表征的在线估计通常通过以下方式完成:(i)施加强大的几何先验,例如平面世界或像素列和BEV射线之间的对应关系,(ii)预测像素的深度概率分布,从2D提升到3D并投影到BEV,一个受到组合误差影响的系统,或(iii)学习多摄像机特征和BEV网格像素之间代价高昂的密集映射。
假设有多个摄像机观察场景,目标是对于自车周围的车辆估计二值占用网格。本文提出一种基于transformer的架构“LaRa”,在扩展回BEV空间之前,将多个摄像机收集的信息有效地聚合为紧凑的潜表征。由于摄像机之间的几何关系应该指导每个摄像机视图的融合,建议用覆盖每个像素光线的几何来增强每个像素。
LaRa架构如图所示:通过共享CNN从图像中提取语义特征(绿色),并与光线嵌入(多色)连接,后者提供几何信息,在摄像机内的像素和摄像机之间的像素建立空间关联。然后,通过1个交叉注意(CA)和 L个自注意(SA)层(黄色),将该表征融合为紧凑的潜表征。用交叉注意查询潜表征获得最终的BEV图,然后用BEV CNN(红色)进行细化。
考虑C个摄像机,摄像机k产生的图像Ik,Rk和tk分别为其外参旋转和平移分量。从这些输入提取两种互补的信息:来自原始图像的语义信息和来自摄像机标定参数的几何线索。
来自原始图像的语义信息
共享图像编码器E为每个图像Ik提取特征图Fk = E(Ik),用预训练的EfficientNet主干实例化E,产生多摄像机特征。然后,这些空间特征图重新排列为一系列特征向量。
利用几何先验
为用几何先验丰富摄像机特征,常用的正弦和余弦空间嵌入在多个摄像机情况下是不明确的。一个简单的解决方案是,除了傅立叶嵌入之外,用依赖于摄像机的可学习嵌入来消除摄像机之间的歧义。然而,在设置中,摄像机之间的几何关系(由摄像机装备的结构定义)对于指导视图融合至关重要。这促使利用摄像机的内外参数来编码自车帧中每个像素的位置和方向。
更准确地说,通过为摄像机的每个像素构建观察光线,编码摄像机标定参数。给定在摄像机图像Ik的像素坐标,捕获x的射线方向rk(x)用以下公式计算:
然后,为了充分描述捕获像素x的光线位置和方向,嵌入rayk(x)计算如下:
该计算在摄像机内和摄像机之间是一致的,并且显示了一个有趣的特性:具有相同光学中心的两个摄像机重叠区域具有相同的光线嵌入。请注意,内参根据Ik和Fk之间的分辨率差异进行缩放。最终输入向量序列通过串联每个特征向量Fk(x)及其几何嵌入rayk(x)。
作者基于通用架构的发现,用中等固定大小的潜空间,而不是学习多摄像机特征和BEV空间之间的二次“all-to-all”对应关系,去控制图像到BEV块的计算和内存开销。形式上,来自所有摄像机的视觉表征Fk及其相应的几何嵌入rayk,通过交叉注意压缩为N个可学习潜表征的集合。无论输入特征分辨率或摄像机数量如何,都能够有效地融合来自所有摄像机所处理的语义信息。基于潜查询,该公式将网络的深度多视图处理与输入和输出分辨率解耦。因此,该架构可以利用BEV网格的完整分辨率。
最后一步从潜空间解码二值分割预测。实际上,在最终预测分辨率下潜向量与BEV“查询”网格Q交叉参与(cross- attended)。查询网格的每个元素都是一个特征向量,用于编码BEV的空间位置,指定交叉注意将从潜表示中提取哪些信息。最后一个交叉注意在BEV空间中生成了一个特征图,用一个小型卷积编码器-解码器U-Net(BEV-CNN)进一步细化,最终预测二值BEV语义图。
具体来说,考虑两种查询的组合:BEV空间的归一化坐标和归一化径向距离。归一化坐标对BEV平面以自车为中心的归一化坐标进行编码。计算按照以下公式获得:
归一化径向距离就是图像像素相对中心的欧氏距离:
虽然该网络可以使用MLPbev从Qcoords生成类似的嵌入,但发现沿Qcoords引入这些径向嵌入改善了结果。此外,与更经典的傅立叶嵌入和学习的查询嵌入相比,这种查询解码选择更有利,如下表所示:
如图是uScenes 数据集的6个周视摄像头图像:
实验结果如下:
如图展示车辆周围的六个摄像头视图以及分割真值:在真值(GT)地图中,车辆显示为蓝色(可见性>40%)或紫色(可见性<40%)。
责任编辑:hnmd003
相关阅读
-
全球热文:LaRa:用于多摄像头BEV语义分割的潜表征和光线嵌入
arXiv上传于2022年6月27日的论文“LaRa:LatentsandRaysforMulti-CameraBird’s-Eye-ViewSemanticSegment...
2022-07-10 -
每日热门:一周公告合辑丨百强房企半年销售额遭腰斩 房企“翻越”偿债高峰
01企业动态Businessdynamics鲁商服务于港交所主板上市跌超21%任林7月8日起获委任为北京建设执行董事SOHO...
2022-07-10 -
全球热文:LaRa:用于多摄像头BEV语义分割的潜表征和光线嵌入
arXiv上传于2022年6月27日的论文“LaRa:LatentsandRaysforMulti-CameraBird’s-Eye-ViewSemanticSegment...
2022-07-10 -
-
2022 AD CASA“冶园·永续”开幕,梦洁旗下高端品牌寐MINE筑诗意栖居艺术
生活就像一部戏剧,我们努力扮演着个性迥然的角色,并与世界维持着千丝万缕的关联,回归家中,褪下生活...
2022-07-09 -
播报:CBRE世邦魏理仕:上半年北京商务园区租金缓慢下行,租金报价每月每平方米161.0元|展望2022下半场
7月7日,CBRE世邦魏理仕发布《2022年上半年北京房地产市场回顾与展望》,根据报告,2022年上半年北京商...
2022-07-09 -
焦点热文:工信部等部门提升技术防范能力,助力治理电信网络诈骗
用好反诈利器 构筑严密防线(建设更高水平的平安中国)工信部等部门提升技术防范能力,助力治理电信网络诈骗用好反诈利器构筑严密防线(建设更高水平的平安中...
2022-07-09 -
环球今亮点!植信投资研究院:房贷利率存在进一步下调的空间|展望2022下半场
7月8日上午,植信投资研究院发布《2022年房地产市场下半年展望报告》,报告认为,下半年金融环境将进一...
2022-07-09
阅读排行
资讯播报
- 世界观察:植信投资研究院:二级...
- 即时看!党旗在基层一线高高飘扬...
- 环球即时看!上半年弘阳地产合约...
- 长城皮卡6月全球销售21251台长城...
- 全新EKSKIDS益卡思第六空间旗舰...
- 打破传统 维他柠檬茶真材实料看得到
- "冠军私募教父"丁海松成长史
- 燕园人合已完成集团化和战略布局
- 消费群体对重口味仍有偏爱 健康...
- 夏日美白大招!种草片仔癀牌雪肌...
- 三餐知营养 生活更健康 维他奶...
- 告别“30元”时代 价格下调进一...
- 隐私面单普及率并不高 快递面单...
- 坚持从严从实抓好疫情防控 北京...
- 农产品上行渠道日益畅通 上半年...
- 不存在“食品级”化妆品 儿童误...
- 国家队入场数字藏品,文旅部官方...
- 片仔癀牌雪肌无瑕润白雪融霜:夏...
- 心动官宣!李一桐成为PIT品牌形...
- 大众+特色+高频 米非线·山菌乌...
- 平安人寿上海分公司:奋进新征程...
- 世界微资讯!深圳前海一方恒融商...
- 环球最新:旭辉控股:执行董事陈...
- 世界实时:东恒国际物业注册资本...
- 天天简讯:动力电池结构之争:CTP VS CTC
- 熟悉的岗位亲切又安心 北京餐饮...
- 全球热头条丨群核科技:连亏近7...
- 14个招商合作项目涵盖多个领域 ...
- 【隐舍瑜伽】瑜伽团课服务新标准...
- 亚洲文化旅游行业首次一齐探索如...
- 新资讯:我爱我家终止2021年非公...
- 5月当月我国服务进出口总额4562....
- 当前时讯:首创集团8.01亿元ABS...
- 世界热头条丨阳光100中国上半年...
- 信息:济南印发人才服务支持政策...
- 世界观天下!早读拾光(7.8)丨...
- 焦点速讯:中国十九冶集团首席技...
- 焦点速递!直播丨动力电池集成及...
- 【环球播资讯】永威置业陷郑州学...
- 天天百事通!开发商不惜代价卖房...
- 环球关注:我国首个商业航天发射...
- 焦点快报!特写:纳达尔的“以一...
- 当前看点!我爱我家终止非公开发...
- 焦点快播:河北塞罕坝机械林场 ...
- 环球信息:西班牙网球名将纳达尔...
- 当前视点!夜读·房企融资|保利...
- 观速讯丨联播+|习近平:忘记历...
- 环球头条:针落有声,追寻静谧舒...
- 世界观天下!新华时评:做好督察...
- 每日看点!八一锐评丨常看看宛平...
- 环球速看:中国足协:各俱乐部7...
- 环球热讯:“西部陆海新通道RCEP...
- 每日热讯!中海2022年上半年累计...
- 全球微资讯!SOHO中国:首席财务...
- 天天播报:暑期来临青少年如何合...
- 天天快看点丨全国联赛来了!一夜...
- 观察:深圳大鹏湾LNG枢纽港接卸...
- 今日要闻!贝壳旗下整装品牌圣都...
- 世界快资讯丨京津冀交通一体化进...
- 环球今热点:一文读懂自动驾驶2D...
- 天天观察:电动汽车电池包热管理...
- 环球热头条丨教育信息化稳步推进...
- 观焦点:天津这个百亿级城市更新...
- 燃爆现场!国联水产集团携“预制...
- 元培智库推荐管理专家—马玉清
- 瞭望|养老保险“一个都不能少”
- JBL PARTYBOX ENCORE ESSENTIAL“音乐战将”
- 上千家经销商共同选择!提神宝能...
- 天气炎热没有胃口 夏日本命原来...
- 7.8保险公众日|结肠癌突发获赔50...
- 唤醒让“Z世代”念念不忘的美好...
- 阿诗丹顿灶具A356B-1,在家当大...
- 当“囤纸巾”成为潮流,太阳纸巾...
- 天天热消息:巍山县旅游投资拟转...
- 每日头条!力高集团:与康佳集团...
- 【环球新要闻】鹏华深圳能源REIT...
- 魔方网表,低调的无代码开发王者
- 世界热点!农化大王的地产苦果
- 微动态丨深圳有望“一人购房全家...
- “有形的手”开始出招 谨慎扩产...
- 深圳配眼镜哪里好?问题集锦,告...
- 提高金融机构对企业离岸贸易背景...
- 【天天报资讯】贵州调整公积金政...
- 环球微头条丨大悦城二季度新增5...
- 今日快看!美国自动驾驶新规:NHT...
- 观察:重庆二批集中供地落幕:1...
- 每日热讯!深圳新规:允许L3智能...
- 环球消息!早读拾光(7.7)丨当代...
- 天天看热讯:万科拟发行34亿公司...
- 世界热点评!浅析高压电池系统的...
- 天天亮点!计划总投资85亿!宇通...
- 【新视野】国创中心与西门子共建...
- 越来越多南方人也开始喜欢 “北...
- 上半年云南有机产品证书数和获证...
- 微资讯!鲁商服务最终发售价每股...
- 每日视点!花样年8亿元公司债券...
- 天天滚动:上海金茂投资20亿元公...
- 世界观天下!还在用小麦西瓜抵扣...
- 今日热讯:深圳公积金提取贷款新...
- 世界播报:东莞优化限购政策 强...