Waymo-自动驾驶长尾问题挑战(2019)

时间：2020-02-23 22:31:18 阅读：162 评论：0 收藏：0 [点我收藏+]

标签：stop 对象 from 人做批量分布开放但我调整

尽管Waymo已经在开放道路上积累超过10 Million Miles，Waymo的工程师们仍然发现有层出不穷的新自动驾驶场景待解决。

1、自动驾驶长尾场景举例

场景一：一个骑自行车的人手中拿着一个Stop Sign标识牌。我们不知道它何时会举起标识牌。无人车必须理解这种场景，即使他举起了Stop Sign标识牌，自动驾驶汽车也不应该停下来。

技术图片

场景二: 迎面而来的车辆上装载的塑料管子撒了一地，自动驾驶汽车必须学会应对这种突发情况，并且避开它们对无人车行驶的影响。

技术图片

场景三：由于道路施工等因素，路面布满锥桶。无人车必须正确识别这些场景，在布满路面锥桶的场景下实现合理驾驶。

技术图片

场景四：路口绿灯，无人车拥有路权，虽然我们的无人车先到达路口，但必须为稍后到达的特种车辆让行。

技术图片

场景五： 路口绿灯，无人车准备左转，遇到闯红灯高速通过的社会车辆，无人车需要识别这种场景，并及时停车避让违规车辆。

技术图片

2、自动驾驶核心模块-Perception, Prediction和Planning

Perception、Prediction和Planning模块是自动驾驶的核心模块，每个模块都存在巨大的挑战。

2.1 Perception

Perception输入：传感器(激光雷达)输入信息以及场景的先验信息。

Perception输出：道路交通对象(行人、车辆等)，对道路场景的语义分割和理解。

Perception本身是一个非常复杂、高难度的问题，它必须能够识别各种形态各异、不同种类的对象。比如下左一图，一群穿着恐龙服的行人，感知必须能够正确识别它们。

技术图片

相同的物体在不同的时间、不同的季节它们的外观表现也会有很大的差异，这会对Perception带来巨大挑战。

技术图片

各种复杂场景的分割理解难度极高。如下图左一：一个搬着箱子的人；下图左三：骑马的人。Perception必须能够正确的分割识别这些场景，而不会因为遮挡导致出现识别的错误。

技术图片

2.2 Prediction

Perception对检测到的物体进行下一步行为的预测，以辅助自动驾驶车辆进行合理的行为决策。

技术图片

Perception要考虑物体的历史行为，比如车辆不会在短时间内实现90度的转弯，因此我们可以假设车辆在短时间内仍然按照当前的朝向和速度前进；要对场景有更高语义层面的理解；要能够关注到不同对象的属性差异和视觉线索，比如车辆大概率是会在车道上行驶上，行人会走斑马线，车辆的朝向能够大概率反应它的意图，如果行人做出停车的手势，大概率是要过马路；要能够解决待预测物体与其它物体的行为交互。

如下图所示，路边有一辆静止的车辆，骑自行车的人在靠近静止车辆时，会侵入无人车车道。Perception模块需要正确理解这些场景，并生成合理的预测曲线。

技术图片