天天动态:PolarFormer:极transformer的多摄像头3D目标检测
arXiv上传2022年6月30日“PolarFormer: Multi-camera 3D Object Detection with Polar Transformers“,作者来自复旦大学张利教授团队。
自动驾驶中的3D目标检测旨在推理3D世界中感兴趣目标的“what”和“where”。现有的3D目标检测方法遵循以往2D目标检测的传统思路,通常采用垂直轴的标准笛卡尔坐标系。然而,这不符合自车透视几何性质,因为每个车载摄像机,都以径向(非垂直)轴成像几何楔形(wedge)内参,去感知世界。因此,本文提倡利用极坐标系,并提出一种
【资料图】
极transformer(PolarFormer)
,以多摄像机2D图像作为输入,用于BEV空间更精确3D目标检测。
具体来说,设计一种不受输入结构形状限制、基于交叉注意的
极检测头(Polar detection head)
,用于处理不规则的极网格(Polar grids)。为了解决沿极距离维度(Polar"s distance dimension)的无约束目标尺度变化,进一步引入一种多尺度
极表征(Polar representation)
学习策略。通过几何约束下
序列到序列(seq-to-seq)
的方式,该模型从相应图像观测的光栅化最佳利用极表征。在nuScenes数据集上的全面实验表明,PolarFormer显著优于最先进的3D目标检测方案,并且在BEV语义分割任务上具有竞争力。
3D目标检测是在无约束的真实场景中实现自主驾驶的一种能力,旨在预测3D世界中感兴趣的单目标位置、尺寸和方向。尽管有良好的成本优势,但基于多摄像机的3D目标检测仍然有特别大的挑战性。为了获得3D表示,通常利用密集深度估计,但不仅计算成本高,而且容易出错。
为了绕过深度估计,最近的方法利用基于查询(query)的2D检测,学习一组稀疏和虚拟嵌入,用于多摄像机3D目标检测,但无法有效建模目标之间的几何结构。通常,在2D或3D空间中采用垂直轴的经典笛卡尔坐标系。这在很大程度上受到所用卷积模型的限制。
相反,在自车的透视图中,每个摄像机下感知的物理世界,是摄像机成像几何楔形内参的形状,具有径向非垂直轴。考虑到这种成像特性,极坐标系应该比通常采用的笛卡尔坐标系更合适、更自然地用于3D目标检测。事实上,极坐标已在一些基于激光雷达的3D感知方法中得到利用。然而,由于卷积网络仅限于矩形网格结构和局部感受野,其在算法上受到限制。
在3D目标检测中,得到了一组N个单目视图,包括输入图像和摄像头内外参。PolarFormer的目标是从多个摄像机视图中学习有效的极BEV表征,以便在极坐标系中预测目标的位置、大小、方向和速度。
PolarFormer由以下部件组成:跨平面编码器首先生成每个输入图像的多尺度特征表示,具备一个跨平面注意机制,其中极查询(Polar queries )处理输入图像在BEV生成3D特征。然后,极对齐(Polar alignment)模块聚集来自多个摄像机视图的极射线(Polar rays),生成结构化极图(Polar map)。此外,极BEV编码器(Polar BEV encoder)通过多尺度特征交互增强极特征(Polar features)。最后,极检测头对极图(Polar map)进行解码,并在极坐标系中预测目标。
为解决具有多粒度细节的无约束目标尺度变化问题,考虑了一种多尺度极BEV表征结构。不同尺度的图像特征有独特的跨平面编码器,并在共享极BEV编码器中相互交互。然后,多尺度极BEV图由极解码头(Polar decoder head)查询。PolarFormer的总体架构如图所示:
跨平面编码器的目标是将图像与极射线相关联。根据摄像机的几何模型,对于任何摄像机坐标(x(C), y(C), z(C)),转换到图像坐标(x(I), y(I))可以描述为:
对任何极BEV坐标
设fn,u,w表示来自第n摄像机、第u尺度和第w列的图像列,ṗn,u,w表示引入的相应极射线查询。跨平面注意力表述为:
沿方位(azimuth)轴叠加极射线特征pn,u,w,得到第n个摄像机和和第u个尺度的极特征图(即极BEV表征)pn,u为:
这种基于序列-到-序列交叉注意的编码器可以对几何成像进行先验编码,并隐式有效地学习深度的替代。
极对齐模块将极射线从不同的摄像机坐标转换为共享的世界坐标。以多视点极特征图和摄像机矩阵为输入,生成相干极BEV图,覆盖所有摄像机视图。具体来说,首先在柱坐标系中均匀生成一组三维点 G(P) = (ρ(P), φ(P), z(P)) 表示。然后将这些点投影到第n个摄像机的图像平面,检索极射线的索引如下:
第u个尺度的相干极BEV图如下生成:
极对齐模块通过沿z轴生成这些点来整合不同高度的特征。学习极坐标表征优于笛卡尔坐标,因为信息损失最小,与原始视觉数据的一致性更高。
利用多尺度特征图处理极坐标中的目标尺度变化。为此,极BEV编码器在相邻像素之间跨多尺度特征地图执行信息交换。形式上,设{Gu}为输入的多尺度极特征图,xˆ为每个查询元素q的参考点的归一化坐标,引入一个多尺度可变形注意模块,如下所示:
作为查询,多尺度特征图中的每个像素利用相邻像素和跨尺度像素的信息。这样在所有特征尺度上学习更丰富的语义。
极解码器解码上述多尺度极特征,在极坐标中进行预测。构造有变形注意的极BEV解码器。
与编码器的2D参考点不同,这里的参考点位于3D柱坐标中,当投影到BEV时,等同于极坐标。每个解码器层的分类分支输出置信度分向量,回归分支的关键学习目标是极坐标,而不是笛卡尔坐标,如图所示:
参考点(ρ,φ,z)在解码器中迭代细化。有了参考点,回归分支输出偏移量dρ、dφ和dz。方向θ和速度v的学习目标相对于目标的方位角,并分解除为正交分量θφ、θρ、vφ和vρ,定义如下:
将目标大小l、w和h回归为对数l、对数w和对数h。分别采用focal loss和L1 loss进行分类和回归。如图是生成多尺度极BEV图的示意图:
实验结果如下:
责任编辑:hnmd003
相关阅读
-
天天动态:PolarFormer:极transformer的多摄像头3D目标检测
arXiv上传2022年6月30日“PolarFormer:Multi-camera3DObjectDetectionwithPolarTransformers“,作者来...
2022-07-11 -
环球速看:NI作为董事会成员加入OAI软件联盟,开发6G接口标准
OpenAirInterface软件联盟(OAI)宣布,全球领先的自动化测试和测量系统开发商之一NI,已加入该组织的战略...
2022-07-11 -
全球热文:LaRa:用于多摄像头BEV语义分割的潜表征和光线嵌入
arXiv上传于2022年6月27日的论文“LaRa:LatentsandRaysforMulti-CameraBird’s-Eye-ViewSemanticSegment...
2022-07-10 -
环球速看:NI作为董事会成员加入OAI软件联盟,开发6G接口标准
OpenAirInterface软件联盟(OAI)宣布,全球领先的自动化测试和测量系统开发商之一NI,已加入该组织的战略...
2022-07-11 -
天天动态:PolarFormer:极transformer的多摄像头3D目标检测
arXiv上传2022年6月30日“PolarFormer:Multi-camera3DObjectDetectionwithPolarTransformers“,作者来...
2022-07-11 -
-
天天新资讯:一边起诉,一边被起诉...这家信托接盘地产后,3日内新增上百条起诉公告
最近一段时间,米哈游和莉莉丝两家游戏大厂起诉五矿信托的消息,成为热门话题。据多家媒体报道,由招行...
2022-07-10 -
每日热门:一周公告合辑丨百强房企半年销售额遭腰斩 房企“翻越”偿债高峰
01企业动态Businessdynamics鲁商服务于港交所主板上市跌超21%任林7月8日起获委任为北京建设执行董事SOHO...
2022-07-10 -
全球热文:LaRa:用于多摄像头BEV语义分割的潜表征和光线嵌入
arXiv上传于2022年6月27日的论文“LaRa:LatentsandRaysforMulti-CameraBird’s-Eye-ViewSemanticSegment...
2022-07-10
阅读排行
资讯播报
- 天天通讯!看见博鳌丨经济学家早...
- 世界快看:基于卡尔曼滤波的道路...
- 天天视点!留在墨尔本的球员身体...
- 焦点报道:2022就业季 | 搭平台...
- 每日速读!碰撞试验直播预告!领...
- 世界新资讯:2022年上半年石家庄...
- 中原证券私募丁海松,独创三大体...
- 53度贵州茅台酒调配的冰淇淋在广...
- 2022 AD CASA“冶园·永续”开...
- 将海外爆款拽下神坛 文明与征服...
- 今日播报!2022年上半年鲁西南区...
- 动态焦点:象棋特级大师柳大华来...
- 播报:CBRE世邦魏理仕:上半年北...
- 世界快看:“才聚荆楚”!湖北出...
- 焦点热文:工信部等部门提升技术...
- 环球今亮点!植信投资研究院:房...
- 短讯!2022赛季场地自行车国家杯...
- 全球滚动:购买养老保险,请记住...
- 前沿热点:54个杭州亚运竞赛场馆...
- 今日关注:人社部提出七项具体措...
- 环球热点评!三人篮球亚洲杯:中...
- 快看:陕西省运动会1.5万余人参...
- 环球速递!龙光集团上半年合约销...
- 世界观察:植信投资研究院:二级...
- 即时看!党旗在基层一线高高飘扬...
- 环球即时看!上半年弘阳地产合约...
- 长城皮卡6月全球销售21251台长城...
- 全新EKSKIDS益卡思第六空间旗舰...
- 打破传统 维他柠檬茶真材实料看得到
- "冠军私募教父"丁海松成长史
- 燕园人合已完成集团化和战略布局
- 消费群体对重口味仍有偏爱 健康...
- 夏日美白大招!种草片仔癀牌雪肌...
- 三餐知营养 生活更健康 维他奶...
- 告别“30元”时代 价格下调进一...
- 隐私面单普及率并不高 快递面单...
- 坚持从严从实抓好疫情防控 北京...
- 农产品上行渠道日益畅通 上半年...
- 不存在“食品级”化妆品 儿童误...
- 国家队入场数字藏品,文旅部官方...
- 片仔癀牌雪肌无瑕润白雪融霜:夏...
- 心动官宣!李一桐成为PIT品牌形...
- 大众+特色+高频 米非线·山菌乌...
- 平安人寿上海分公司:奋进新征程...
- 世界微资讯!深圳前海一方恒融商...
- 环球最新:旭辉控股:执行董事陈...
- 世界实时:东恒国际物业注册资本...
- 天天简讯:动力电池结构之争:CTP VS CTC
- 熟悉的岗位亲切又安心 北京餐饮...
- 全球热头条丨群核科技:连亏近7...
- 14个招商合作项目涵盖多个领域 ...
- 【隐舍瑜伽】瑜伽团课服务新标准...
- 亚洲文化旅游行业首次一齐探索如...
- 新资讯:我爱我家终止2021年非公...
- 5月当月我国服务进出口总额4562....
- 当前时讯:首创集团8.01亿元ABS...
- 世界热头条丨阳光100中国上半年...
- 信息:济南印发人才服务支持政策...
- 世界观天下!早读拾光(7.8)丨...
- 焦点速讯:中国十九冶集团首席技...
- 焦点速递!直播丨动力电池集成及...
- 【环球播资讯】永威置业陷郑州学...
- 天天百事通!开发商不惜代价卖房...
- 环球关注:我国首个商业航天发射...
- 焦点快报!特写:纳达尔的“以一...
- 当前看点!我爱我家终止非公开发...
- 焦点快播:河北塞罕坝机械林场 ...
- 环球信息:西班牙网球名将纳达尔...
- 当前视点!夜读·房企融资|保利...
- 观速讯丨联播+|习近平:忘记历...
- 环球头条:针落有声,追寻静谧舒...
- 世界观天下!新华时评:做好督察...
- 每日看点!八一锐评丨常看看宛平...
- 环球速看:中国足协:各俱乐部7...
- 环球热讯:“西部陆海新通道RCEP...
- 每日热讯!中海2022年上半年累计...
- 全球微资讯!SOHO中国:首席财务...
- 天天播报:暑期来临青少年如何合...
- 天天快看点丨全国联赛来了!一夜...
- 观察:深圳大鹏湾LNG枢纽港接卸...
- 今日要闻!贝壳旗下整装品牌圣都...
- 世界快资讯丨京津冀交通一体化进...
- 环球今热点:一文读懂自动驾驶2D...
- 天天观察:电动汽车电池包热管理...
- 环球热头条丨教育信息化稳步推进...
- 观焦点:天津这个百亿级城市更新...
- 燃爆现场!国联水产集团携“预制...
- 元培智库推荐管理专家—马玉清
- 瞭望|养老保险“一个都不能少”
- JBL PARTYBOX ENCORE ESSENTIAL“音乐战将”
- 上千家经销商共同选择!提神宝能...
- 天气炎热没有胃口 夏日本命原来...
- 7.8保险公众日|结肠癌突发获赔50...
- 唤醒让“Z世代”念念不忘的美好...
- 阿诗丹顿灶具A356B-1,在家当大...
- 当“囤纸巾”成为潮流,太阳纸巾...
- 天天热消息:巍山县旅游投资拟转...
- 每日头条!力高集团:与康佳集团...
- 【环球新要闻】鹏华深圳能源REIT...
- 魔方网表,低调的无代码开发王者