【聚看点】BITS: 交通仿真的双层模仿学习方法
arXiv论文“
BITS: Bi-level Imitation for Traffic Simulation“,2022年8月26日,Nvidia的工作。
【资料图】
仿真是自动驾驶车辆等机器人系统扩大验证和检验(V&V)的关键。尽管在高保真物理模型和传感器模拟方面取得了进展,但在模拟道路使用者的真实行为方面仍存在严重差距。这是因为,与模拟物理模型和图形学不同,为类人行为设计第一原理模型,通常是不可行的。
这项工作
采用一种数据驱动的方法,并提出了一种可以学习真实驾驶日志生成交通行为的方法。
该方法将交通模拟问题解耦为高级意图推理和低级驾驶行为模拟,利用驾驶行为的双层结构,实现了高采样效率和行为多样性。
该方法还结合一个规划模型,获得稳定的长期行为效果。
用两个大规模驾驶数据集的场景对方法进行了经验验证,该方法称为BITS(Bi-level Simulation for Traffic Simulation),并表明BITS在真实性、多样性和长时稳定性方面实现了平衡的交通模拟性能。
还探索了评估行为真实性的方法,并为交通模拟引入了一套评估指标。
最后,开发并开源了一个软件工具,该工具统一了不同驾驶数据集的数据格式,并将现有数据集的场景转换为交互式模拟环境。
如图是BITS的框架:决策上下文ct是一个张量,包含语义图和光栅化智体历史,
按通道连接在一起
。给定ct作为输入,(1)空间目标网络产生短视野目标的2D空间分布,(2)目标条件(goal-conditioned)策略为每个采样目标(goal)生成一组动作,(3)轨迹预测模型预测相邻智体的未来运动,以及最后(4)基于预测的未来状态,该框架选择让基于规则的成本函数最小化的一组动作。交通模拟看作模仿学习
采用以智体为中心的方法进行交通模拟,即每个智体以分散方式进行决策,无需显式协调。其允许与包含其他类型模拟智体的仿真框架灵活地集成,并鼓励出现新的交互行为。这项工作专注于模拟车辆交通,但智体可以是驾驶日志中捕获的任何类型道路用户(例如,骑自行车的和行人)。
用s和c分别表示智体的动态状态和决策上下文。具体而言,状态s包括智体的位置、航向和速度。上下文c=(I,S)包括局部语义图I和一个智体及其N个相邻智体的h个先前状态St−h:t = {s(0),s(1),…,s(N)}。给定决策上下文信息ct和当前状态st,交通仿真模型πθ的目标是生成智体的下一个状态st+1 = T(π
θ(ct),st)
。用动力学约束的简单单轮(unicycle)模型作为T。真实世界中捕获的驾驶日志训练交通模型。由于日志数据很容易包括语义图和所有观测的智体轨迹,将驾驶日志视为一组多智体专家演示序列τ = {c(i)、s(i)、c(i)、(s(i)…、c(i),s(i)},
将交通模拟描述为有监督的模仿学习问题。然而,城市驾驶的性质带来了重大的技术挑战。首先,由于模型无法访问演示者的潜在意图和其他与决策相关的线索,例如其他车辆的转向信号,因此是一个部分观察的决策过程。因此,动作监督本质上是模糊的,通常用概率分布建模。
虽然这种模糊性使训练复杂化,但有效地建模动作分布也可以生成不同的反事实(counterfactual)交通模拟。其次,由于每个智体的行为没有明确的协调,它们的联合行为生成了一个可能未来状态的组合空间。这种不确定性使得生成稳定的交通模拟非常具有挑战性。
双层模仿学习为多模态行为生成
交通模仿模型的目标,是通过学习真实世界的驾驶日志(作为演示),来产生各种各样的合理行为。轨迹预测中的大多数现有方法用深度潜变量模型(例如VAE)来捕获行为分布。然而,学习生成稳定的长视野行为需要大量的训练数据。相反,这里提出的方法将学习问题分解为(1)训练高层目标网络,捕获可能的短期目标空间分布,以及(2)训练确定性目标条件策略,学习如何达到预测目标。
空间目标网络(goal network)利用驾驶运动的2D BEV结构,并用2D网格高效地表示空间目标分布。这种分解将多模态轨迹建模的负担,转移到高级目标预测器,使低级目标条件策略能够重用达成目标的技能,提高样本效率。
为长视野稳定性的预测和规划
这样一个双层模拟学习方法,可以从有限的数据中生成合理的交通模仿。该策略可以从多模态空间目标预测器中采样,综合各种行为。然而,该策略的执行仍然受到训练数据规模和覆盖范围的限制。
驾驶日志偏向于正常行为,几乎不包含碰撞或越野驾驶等安全-紧要情况。生成多样行为的目标进一步放大了这一挑战,因为鼓励智体进入地图上未见过的区域并创建新的交互。因此,为了实现稳定的长时间模拟,即使在缺乏训练数据指导的状态下,智体也必须生成合理的行为。
为此,建议使用预测和规划模块来增强策略,以稳定长期轨迹展开。该模块从上述随机双层策略πθ中提取动作样本at,并根据预测的环境未来状态St:t+H,选择基于规则成本函数C
最小化
的动作,即argmin C(at,St:t+H,ct)。该方法类似于典型的模块化AV堆栈中的运动规划流水线,重要的区别在于,用学习的策略生成类人运动轨迹候选。关键思想是,策略πθ可以直接跟踪分布内状态下的数据似然,其中大多数行为样本都遵循规则,在最可能的动作可能导致不良后果的状态下,接受纠正指导。此外,采样模块允许在无需再训练的情况下对模拟器进行灵活调整(例如,多样性水平、多个目标的强调)。
交通仿真的评估测度
由于缺乏真值,设计仿真指标特别困难。因此,通常用于评估轨迹预测的平均位移误差(ADE)和最终位移误差(FDE)等指标不适合评估仿真模型。为了解决这一评估差距,文章提出了三种模拟度量:(i)度量模拟智体违反公共交通规则的程度,如越野驾驶或与其他智体发生碰撞;(ii)测量模拟展开的统计数据指标,包括在驾驶特性方面与收集的驾驶日志的相似性,如速度曲线、控制力、驾驶区域的覆盖率以及不同模拟试验之间的行为多样性;(iii)从真实世界驾驶日志中学习到的数据驱动指标,例如在数据驱动的轨迹预测模型下,
测量
模拟展开的可能性。SimNet是一种用于交通模拟的确定性行为克隆模型。TrafficSim是原始交通模拟方法以智体为中心的自适应,其特征是各向同性高斯CVAE(isotropic Gaussian CVAE)。消除训练中的场景一致性损失,因为不承担对所有智体的控制。SocialGAN通过对抗性模仿学习生成轨迹。TPP改编自Trajectron++,包括一个离散CVAE,每个离散模式具有高斯轨迹解码器。
还考虑了这些方法的变型,并使用规划和控制模块(标记为“+p”),即选择具有成本函数的未来动作样本。
实验结果如下:
责任编辑:hnmd003
相关阅读
-
【聚看点】BITS: 交通仿真的双层模仿学习方法
arXiv论文“BITS:Bi-levelImitationforTrafficSimulation“,2022年8月26日,Nvidia的工作。仿真是自动...
2022-09-01 -
全球快看点丨汽标委智能网联汽车分标委先进驾驶辅助系统(ADAS)标准工作组第十五次会议及相关标准系列会议在青岛召开
为贯彻落实《国家车联网标准体系建设指南(智能网联汽车)》《汽车产业中长期发展规划》等文件中关于智...
2022-08-31 -
建议居家不外出 深圳非中高风险来(返)穗人员需实施严格3天居家健康监测
居家隔离医学观察(简称居家隔离),是指对密切接触者和密接的密接中特殊人群、实施14+7的入境人员、出院...
2022-09-01 -
以社区三人小组具体执行为主 深圳现在能不能来广州敬请密切关注官方发布
居家隔离医学观察(简称居家隔离),是指对密切接触者和密接的密接中特殊人群、实施14+7的入境人员、出院...
2022-09-01 -
【聚看点】BITS: 交通仿真的双层模仿学习方法
arXiv论文“BITS:Bi-levelImitationforTrafficSimulation“,2022年8月26日,Nvidia的工作。仿真是自动...
2022-09-01 -
2022上海国际美妆节慈善之夜,关爱自闭症,为爱举手,与爱同行
2022年8月25日,由上海市商务委员会、上海静安区人民政府主办,上海市静安区商务委员会承办,CGC Girls...
2022-09-01 -
环球要闻:吸引全球1.48万名创业人才 HICOOL释放北京科创磁力
原标题:吸引全球1 48万名创业人才1 1万个创业项目参与HICOOL释放北京科创磁力8月28日,HICOOL全球创...
2022-09-01 -
今日关注:嘉兴平湖、桐乡各挂牌出让一宗涉宅地 起价分别为3.57亿元、1.03亿元
8月31日,嘉兴平湖市挂牌1宗宅地,预计10月11日出让。据观点新媒体了解,平湖宅地位于港区王家堰路北侧...
2022-09-01 -
以精英化的职业来佐证女性独立自主的魅力 《玫瑰之战》将有效套路皆囊括其中
新近收官的《玫瑰之战》获得了美国CBS电视台的授权,从剧情及人物关系设定中不难看出,该剧是以《傲骨贤...
2022-09-01
阅读排行
资讯播报
- 全球观热点:2022年铁路暑运收官...
- 一警一“匪”亦友亦敌 电视剧《...
- 每日快看:温州苍南县挂牌一宗2....
- 张律这份自洽且松弛的创作姿态 ...
- 以独具地方特色的唱腔和表演手法...
- 入选国家工业文化教学基地为辽宁...
- 数字人民币穿透支付业务为保障农...
- 环球看点!广东出台措施加大力度...
- 复制推广新一批试点成果 商务部...
- 8月份大中型企业采购经理指数较...
- 快消息!王曦雨职业生涯首胜世界...
- 稳步扩大REITs试点范围和规模完...
- 1-7月全国共销售彩票2134.33亿元...
- 环球信息:恒大地产:因经营情况...
- 全球快看点丨中国男排结束世锦赛...
- 身临其境感受元宇宙的魅力 环境...
- 多种形式扩大销售规模 去年生活...
- 【全球独家】中国奥园:延迟刊发...
- 聚焦:三盛控股:延迟发布2022年...
- 今日看点:和讯曝财报丨融信服务...
- 8月份制造业产需指数一平一升 ...
- 网民人均每周上网时长为29.5个小...
- 坚持“四项基本制度” 交通运输...
- 环球观焦点:华润置地沈阳公司中...
- 世界短讯!半年报速递|绿地香港...
- 【环球新要闻】半年报速递|融信...
- 快消息!半年报速递|祥生控股上...
- 全球消息!中国奥园西安、重庆项...
- 全球滚动:半年报速递|德信中国...
- 天天快看点丨武磊:希望用自己国...
- 全球今热点:招商蛇口子公司广州...
- 世界最新:2022年国家网络安全宣...
- 焦点消息!三巽集团:上半年归属...
- 全球实时:卓尔智联:上半年实现...
- 环球视点!力高集团:上半年归属...
- 每日快看:国瑞健康:上半年归属...
- 今日精选:周琦当选世预赛亚大区...
- 看点:德信中国:上半年实现收入...
- 速讯:国锐地产:上半年实现收入...
- 热门看点:孙嘉泽2杆领跑中国信...
- 环球百事通!和讯曝财报丨佳源服...
- 焦点速讯:和讯曝财报丨荣万家20...
- 世界视点!和讯曝财报丨宋都服务...
- 当前报道:林中、林伟、林峰增持...
- 即时看!建发集团与中国银行签署...
- 天天最新:因工程款及违约金纠纷...
- 世界球精选!“全国青少年体育文...
- 全球观点:和泓服务:上半年实现...
- 每日播报!头部房企回暖加速,龙...
- 焦点精选!财面儿丨大名城:控股...
- 世界快资讯丨物业|宋都服务2022...
- 全球通讯!荣万家:上半年归属股...
- 环球即时看!中指院:前8月销售...
- 天天快资讯:物业|佳源服务2022...
- 当前热讯:佳源服务:上半年实现...
- 今日聚焦!蓝光发展:蓝光集团已...
- 今日快看!港七月商厦买卖登记78...
- 快报:首批保障性租赁住房REITs...
- 全球热点评!2022年国家网络安全...
- 全球快看点丨汽标委智能网联汽车...
- 【播资讯】多地整治住房租赁市场...
- 今亮点!国家体育总局发布干部调...
- 环球关注:全国中小微企业达四千...
- “可溯源性+技术创新“成就福客...
- 世界新消息丨红旗连锁拟于成都龙...
- 天天最新:和讯曝财报丨帝欧家居...
- 【环球新要闻】广州地铁集团上半...
- 全球热头条丨香港九龙城嘉林边道...
- 环球微速讯:远洋集团:上半年营...
- 碰碰狐近期资讯:鲨鱼宝宝主题大...
- 全球微资讯!亚洲杯赛场打出风格...
- 环球滚动:中海物业:上半年归属...
- 环球微动态丨旭辉控股:拟配售发...
- 世界观天下!湖北黄梅:“新农人...
- 世界速递!美国网球公开赛:郑钦...
- 【当前独家】和讯曝财报丨三棵树...
- 【天天热闻】我国网民规模达10.5...
- 热推荐:新时尚运动:要炫酷更要...
- 天天观速讯丨半年报速递|华润万...
- 每日热议!半年报速递|华润置地...
- 微微初心,巍巍使命 第一期“常...
- 【天天新要闻】政企合力换来消费...
- 全球时讯:我国网络诚信发展年度...
- 天天实时:声动中国丨致敬,每一...
- 每日热闻!第二十届北京晚报高帝...
- 世界热消息:2022日本羽毛球公开...
- 膜法世家携手贵州医科大学,布局...
- 聚焦健康生活消费新趋势 摩摩哒...
- 上海家长学校为家长送上开学礼
- 永和豆浆品质创新,打造特色豆浆...
- 区门票低至20元 2022年9月1日-2...
- 通过线上线下结合方式 云台山景...
- ColorOS 13正式发布:流畅度大...
- 敢标真年份,内行喝潭酒!第九届...
- 型男护肤,片仔癀牌男士净爽控油...
- 紧密联通中国与世界 服贸会10年...
- 释放出巨大的生产和科研价值 机...
- 国内成员单位中有26个省市已经布...
- 跨座式单轨交通应按远期预测的客...
- 上半年助企纾困政策具体都有哪些...