无人系统的自主决策与协同环境探索

  报告时间:2021年12月3日(周五)下午3:00

  报告地点: 计算所446会议室

  邀请人:李玮 副研究员

  

  论坛报告1:自动驾驶中可信赖的强化学习决策方法研究与应用

  摘要:自动驾驶汽车目前正处于从典型场景应用向大规模开放道路应用的关键节点,其自主决策方法面临驾驶环境的复杂随机性带来的挑战。强化学习决策方法能够利用试错学习机制适应环境特征,是目前自动驾驶智能决策领域的前沿方向。其瓶颈在于存在黑盒决策特点,导致决策失效难以追溯应对,这与车辆高可靠性需求相矛盾,极大地制约了该技术在自动驾驶上的应用。本次报告将分享我们团队对可信赖的强化学习决策方法开展的研究,包括导致低可信性的部分原因分析和补偿方法。所提出的方法已在自动驾驶汽车上开展了数百公里的开放道路测试,通过65项功能场景的第三方测试,实现了强化学习决策的长距离开放道路驾驶,服务于北京科技冬奥自动驾驶示范项目。

  嘉宾简介:

  曹重,清华大学车辆与运载学院博士后,2020年获清华大学工学博士学位,曾于2017-2019年在美国密歇根大学MCITY自动驾驶测试中心进行联合培养,研究领域包括自动驾驶自主决策、强化学习、持续学习等。主持国家自然科学基金青年基金“自动驾驶可信赖的强化学习决策方法”、博士后基金面上项目“面向长尾场景的自动驾驶汽车决策持续学习方法研究”,参与北京科技冬奥项目、北美丰田项目等。发表论文19篇,申请/授权专利15项,获得由Waymo等公司支持的CARLA仿真挑战赛获决策组第2/68名(排序1/3),获清华大学水木学者称号、中国汽车工程学会优秀博士论文提名。

 

  论坛报告2:通信受限条件下的多智能体协同环境探索

  摘要:自主对环境未知区域进行探索,是机器人领域的基础任务。采用多个智能体对环境进行协同探索,相比于单个机器人独立探索,可以成倍提升探索效率,对于抢险救灾等时间敏感的任务具备重大意义。 实际环境中,由于基础设施损坏,如通信基站损毁或者GNSS信号干扰,导致通信和定位受限,成为了多机环境探索系统应用的重大阻碍。本报告面向通信受限条件下的多机协同环境探索任务,针对2D环境探索,提出了基于子地图的多机环境探索框架降低了30%以上的数据传输需求和时间。针对3D环境探索,利用混合高斯模型完成地图表示,将数据需求降低2个数量级。针对环境目标搜索等任务,利用拓扑节点完成地图表示,进一步降低多机间通信量需求。

  嘉宾简介:

  余金城,清华大学电子系博士后。2021年于清华大学电子系取得工学博士学位,主要研究方向是计算和通信资源受限条件下的多机协同智能系统。包括领域专用硬件加速器设计、多机协同系统与算法研究、支持协同系统任务的云机器人平台和云测试场研究。在ICRA、DAC等会议和期刊上发表论文18篇。获清华大学水木学者称号。