虚-实和实-虚的场景图像合成方法
虚-实图像合成方法 (资料图片仅供参考)
即使是最复杂的游戏,其实时渲染依然
⽆
法实现真实的现实场景,
⼈
眼
⼀
眼就能分辨模拟图像和真实图像。
Intel的工作
EPE(
Enhancing Photorealistic Enhancement)【
1】利
⽤
游戏引擎渲染过程中产
⽣
的中间结果
G-Buffers,作为训练卷积神经
⽹
络的额外输
⼊
信号,可进
⼀
步增强游戏中图像的真实性。不直接
⽣
成数据,
⽽
是在已经渲染的图像上进
⾏
增强,集成场景信息来合成
⼏
何和语义
⼀
致的图像。
在
EPE中,卷积网络利用传统渲染流水线生成中间表征
G-buffers,提供景深、形状、光照、透明度、材质等特征信息;通过对抗目标训练,在多个感知层提供监督信号,用
GAN的鉴别器评估增强图像的真实性;在训练过程中对图像块进行采样,以消除图像伪影。
其网络模型有两个改进点:
1
)普通卷积取代
strided convolution;
2
)渲染
-觉察非规范化(
rendering-aware denormalization, RAD)模块,取代
BN层。
如图所示
EPE的总体框架:图像增强网络(
Image Enhancement Network)可以转换渲染的图像,除了图像,还有来自传统图形学流水线的渲染信息
G-buffer,网络提取多尺度
G- buffer特征张量,由
G-buffer编码器网络(
Encoder)编码;通过
LPIPS(
Learned Perceptual Image Patch Similarity)损失保持渲染图像的结构,以及感知鉴别器(
Perceptual Discriminator)最大化增强图像的真实性,这样联合训练两个网络。
如图是图像增强网络架构:让
RAD模块替换
HRNet中的
BN层,形成一个
RAD-块(
RB);
HRNet每个分支,在匹配尺度接收一个
G-buffer特征张量。
RAD
通过来自传统渲染流水线的编码几何、材质、照明和语义信息来调整图像特征张量。图像特征通过
Group Normalization进行归一化,然后通过每个元素权重进行尺度伸缩和移位。学习权重并适应
G- buffer编码器接收的
G- buffer特征。为了更好地适应权重,通过每个
RAD模块内的三个残差块来变换
G-buffer特征。
如图是
G-buffer编码器网络架构图:考虑不同的数据类型和
G- buffer的不同空间密度,通过多个流(
0–c)处理这些特征,融合到一个和
one-hot编码目标
ID一致的联合表征中;通过残差块进一步变换特征;与图像增强网络中的分支,尺度做到匹配。
在
G-buffer编码器和
RAD模块中,都采用残差块:由卷积层(核大小为
3)组成,具有频谱归一化(
spectral normalization)和
ReLU。
如图是感知鉴别器网络架构图:感知鉴别器评估增强图像的真实性,其由预训练的鲁棒分割(
MSeg)和感知(
VGG)网络(绿色)组成;通过标签图和感知特征张量提供高级语义信息;图和张量被鉴别器网络获取,产生真实感分数图。
2.实-虚图像合成方法
当前的图像仿真工作要么无法实现真实感,要么无法模拟3D环境和其中的动态目标,从而失去了高级控制和物理真实感。GeoSim
【
2】是
Uber提出的一种几何
-觉察图像合成过程,从其他场景提取动态目标以新姿态渲染,增强现有图像,合成新自动驾驶场景。
其构建一个具有真实几何形状和传感器数据外观的多样化
3D目标库。在仿真过程中,合成方法完成几何
-觉察的模拟工作:
1.
在给定场景放置合理真实的目标,
2.
从资产库中得到动态目标新视图,
3.
合成和混合渲染该图像。
生成的合成图像具有真实感、交通
-觉察和几何一致性,允许扩展到复杂用例。跨多个摄像头传感器进行远程逼真视频模拟,数据生成结果做下游任务数据增强。
如图所示是为自动驾驶通过几何
-觉察合成的真实感视频仿真:一种数据驱动的图像处理方法,将动态目标插入现有视频中。生成的合成视频片段是高度逼真、布局清晰且几何一致,允许图像模拟扩展到复杂用例。
首先通过执行
3D目标检测和跟踪来推断场景中所有目标的位置。对于要插入的每个新目标,根据高清地图和现有检测的交通,选择放置位置以及使用哪个目标模型。然后,为新放置的目标使用智能驾驶员模型(
IDM),为了使其运动逼真,考虑与其他参与者的交互并避免碰撞。该过程的输出定义了要呈现的新场景。然后,用具有
3D遮挡推理的新视图渲染,对场景中的所有元素进行渲染,在新图像中创建新目标的外观。最后,用神经网络来填充插入目标的边界,创建任何丢失的纹理并处理不一致的照明。
如图是
3D目标放置、片段检索和仿真示意图:
3D-觉察场景表征、碰撞
-觉察的位置设定和视频仿真概览。
希望在现有的图像中放置新目标,保证在规模、位置、方向和运动方面都是合理的。为了实现这一目标,利用城市中车辆行为的先验信息。用
2D
目标插入很难实现类似的真实感水平。因此,用有
BEV
车道位置的高清地图,目标位置参数化为
BEV
目标中心和方向三元组,随后用局部地面高程将其转换为
6DoF
姿态。
目标样本应该与现有目标有真实的物理交互,符合交通流,并在摄像头的视野中可见。为了实现这一点,从摄像头视野内的车道区域中随机采样一个位置,并从车道中检索方向。拒绝所有导致与其他参与者或背景目标碰撞的样本,最后得到目标在初始帧的放置。为模拟视频模拟中随时间推移的合理位置,用智能驾驶员模型(
IDM)拟合运动模型,更新模拟目标的状态,与周围交通进行真实交互。
插入的目标必须遵守现有场景元素的遮挡关系。例如,植被、栅栏和其他动态目标可能具有不规则或薄的边界,使遮挡原因复杂化。一种简单的策略是,将插入目标的深度与现有
3D场景的深度图进行比较,确定目标场景中插入目标及其阴影的遮挡,如图
10-41所示:为了实现这一点,首先通过一个深度补全网络(
depth completion)估计目标图像的密集深度图。输入是
RGB图像和通过激光雷达扫描投影到图像上而获取的稀疏深度图。用这个目标的渲染深度,评估目标图像的深度是否小于相应目标像素的深度,可计算得到遮挡掩码。
在遮挡推理之后,渲染的图像可能看起来仍然不真实,因为插入片段可能是与目标场景不一致的照明和颜色平衡、还有边界处的差异,以及来源视图的缺失区域。为了解决这些问题,用图像合成网络(
SynNet)将源片段自然地混合到目标场景,如图所示:网络将目标背景图像、渲染的目标物体(
target object)以及目标轮廓作为输入,并输出自然合成背景和渲染目标的最终图像。
合成网络架构类似于图像补全网络,只是将渲染的目标掩码作为附加输入。网络用目标场景中实例分割掩码图像进行训练。
3 参考文献
【1】
S R. Richter, H Ab Alhaija, and V Koltun,“Enhancing Photorealistic Enhancement“(EPE),IEEE T-PAMI,2021
【2】Y Chen, F Rong,S Duggal, S Wang,X Yan,S Manivasagam,S Xue,E Yumer,R Urtasun,“GeoSim: Realistic Video Simulation via Geometry-Aware Composition for Self-Driving“,arXiv 2101.06543,2021
责任编辑:hnmd003
相关阅读
-
《2022中国香水行业研究白皮书》发布: 香氛新赛道发展迅速,“情绪疗愈”成为消费重要关注点
2022年12月14日,由颖通集团携手凯度中国举办的领潮·创变——2022中国香水行业研究白皮书(以下简称白...
2022-12-20 -
每日热讯!利福国际:撤销上市地位将自12月20日下午四时起生效
12月19日消息,利福国际发布公告,并计划已于2022年12月19日生效,撤销股份在联交所的上市地位将自2022...
2022-12-20
阅读排行
资讯播报
- 当前速看:一种有效设计密封件以...
- 时代吉利动力电池宜宾项目一期...
- 滚动:高炳钊:智能线控底盘非线...
- 热点评!公摊面积内卫生间“消失...
- 当前消息!复星旅文:委任何建民...
- 环球观点:房产中介推销“添油加...
- 全球热消息:卡塔尔世界杯32支参...
- 当前热议!德尚:看好4年后的法国队
- 全球今亮点!因现行市况 达美乐...
- 天天报道:梅西夺冠时刻家人伴其...
- 【环球聚看点】从南美、欧洲争霸...
- 世界观焦点:第三届中俄冬季青少...
- 今日热门!房地产逆周期之下,贝...
- 三湘印象拟非公开发行股票 募集...
- 当前快看:广东东莞4宗地块56亿...
- 东百集团1亿元超短期融资券将付...
- 全球看点:快讯丨华发股份:选举...
- 前11个月上海商品房销售面积约15...
- 【全球新视野】红星美凯龙拟对子...
- 金科股份:截至 2022年11月末,...
- 北上广深等13市共同发布《城市治...
- 当贝以世界杯高位切入体育营销,...
- 世界快报:天津四批供地24宗地全...
- 【券商聚焦】中信证券指地产市场...
- 全球今亮点!中铁建设创业大厦6....
- 洛阳城乡建投40亿元私募债状态更...
- 金桥×阿里云共育,2022全球“未...
- 焦点速看:华润置地35亿元超短期...
- 当前观点:某乘用车塑料燃油箱晃...
- 2022中国镜泊湖公开水域游泳挑战...
- 迪马股份:陈涵辞任公司副总裁职务
- 青岛崂山两宗地触发熔断转入线下...
- 世界今亮点!发改委:到2025年全...
- 【全球速看料】1-11月上海市实现...
- 环球讯息:南宁五象新区建投拟发...
- 搞笑版卡塔尔世界杯颁奖来了!还...
- 第一次走出大山的中国足球少年,...
- 【聚看点】2022海南儋州马拉松赛...
- 观焦点:用政策“红包”激活更多...
- 银川中房物业注册资本增加778万...
- 环球热点!每日一星:神迹梅西
- 上海松江今年推出1701套公租房
- 环球微速讯:长沙主城区绿色交通...
- 今日看点:建立“需求拉动型”房...
- 环球关注:青鱼之乡冬捕忙 浙北...
- 环球快消息!一群孩子的建议正在...
- 环球快看点丨衰退模型?动力电池...
- 热推荐:汽车线束设计思路及零件...
- 【全球热闻】安徽芜湖发展低空经...
- 焦点热门:汩汩清水跨界来——小...
- 自动驾驶汽车行为预测综述
- 天天看热讯:中交地产:10亿元公...
- 环球快资讯丨“拥抱”属于足球的...
- 热点在线丨江西:从“穷守青山”...
- 环球短讯!TSI 3795 型纳米颗...
- 佰洛雅Pluryal携雅溯疗法与美莱...
- 梅西加冕!海信电视为潘帕斯雄鹰...
- 皇后片仔癀珍珠膏系列:国货护肤...
- 喝金沙摘要酒,实惠价格品千年酱...
- 圣爱中医大讲堂流派第五讲:管遵...
- 采购萌宠主题儿童游乐设备?认准H...
- 永和食品寒冬送温暖,捐赠100万...
- 咸宜镇:打造高山生态城口老腊肉...
- 小白熊婴儿紫外线消毒柜,让育儿...
- 用这些拥抱,定格这个属于足球的...
- 圣爱刘琼:向社会提供免费大锅药...
- 环球快讯:这一吻梅西等了8年,阿...
- 世界速讯:上海茶叶进出口公司挂...
- 【新要闻】中国铁建转让苏州京发...
- 焦点短讯!广东男篮116比105大胜...
- 深度布局储能市场,华自科技解电...
- 昭衍·讲堂 :AAV载体药物临床...
- 梅西再获世界杯金球奖 创多项纪录
- 聚焦消费新时代,小白熊赋能母婴...
- 每日视讯:重磅官宣!上海蔚赫收...
- 济南城建集团拟发7亿元公司债 ...
- 天天热推荐:区域新盘观察 | ...
- 每日聚焦:造富雪道 | “无人...
- 阿根廷点球大战击败法国 第三次...
- 环球观天下!梅西:想以世界冠军...
- 天天快消息!梅西伟大且不可复制...
- 资本圈 | 华润置地35亿超短债...
- 阿根廷夺冠,梅西圆梦!
- 环球精选!卡塔尔世界杯各奖项公...
- 梅西亲吻并高举大力神杯!这次再...
- 世界微速讯:经历挫折然后成长,...
- 全球热门:世界杯决赛双方首发阵...
- 这是足球,最美的样子
- 全球动态:海峡两岸青年福州“橄”拼
- 全球热文:合景泰富拟配售2.35亿...
- 【聚看点】卡塔尔世界杯吉祥物被...
- 2022第十二届贵阳汽车文化节市民...
- 全球消息!古驿道定向赛再次跑进...
- 当前焦点!2022年第五届广东省马...
- 观察:行至终章的世界杯,多了些...
- 近千名越野爱好者福建邵武开跑
- 西藏天路:拟以自有资金参与认购...
- 环球热推荐:中国队里的俄籍教练...
- 全球消息!华南城拟50亿出售西安...
- 世界杯观赛神器,Z世代消费者首...