一个不需要再等红灯的未来?
编译 / 张 鸥
编辑 / 涂彦平
设计 / 赵昊然
来源 / MIT,作者:Adam Zewe/MIT News Office
没有人喜欢坐在红灯前。
车辆停下来等待信号灯变化,当然是交通管制的必备基本措施,但是不免会使赶时间的人更加心急如焚。事实上,这些时间也是在持续消耗不必要的燃料并排放温室气体。
如果驾驶者可以掌握他们的出行时间,做到在绿灯时到达十字路口呢?
在一项新的研究中,麻省理工学院的研究人员展示了一种机器学习方法,该方法可以学习控制自动驾驶车队,当它们接近并通过一个有信号灯的十字路口时,能够保持交通顺畅。
通过模拟,他们发现该方法可以减少燃料消耗和排放,同时提高平均车速。如果道路上的所有汽车都具备自动驾驶功能,这项技术会得到最好的实施结果,但即便只有25%的汽车使用他们的控制算法,仍然会带来巨大的燃料和排放效益。
“十字路口是一个非常有趣的、可以进行干预的地方。”高级作者凯茜·吴(Cathy Wu)说。她是土木与环境工程系Gilbert W. Winslow职业发展助理教授,也是数据、系统和社会研究所(IDSS)和信息与决策系统实验室(LIDS)的成员。
本次研究的主要作者是文杜拉·贾亚瓦达纳(Vindula Jayawardana),LIDS和电气工程与计算机科学系的研究生。研究将在2022年7月11-14日举办的欧洲控制会议(ECC)上发表。
错综复杂的十字路口
十字路口可能会出现数十亿种不同的情况,这取决于车道的数量、信号灯的运作方式、车辆的数量和速度、行人和骑车人的存在等等。
解决十字路口控制问题的典型方法是使用数学模型来得出一个简单、理想的交叉口。这在纸面上看起来不错,但在现实世界中很可能站不住脚,因为真实的交通状况往往是混乱的。
文杜拉和凯茜换了个角度,使用一种被称为深度强化学习的无模型技术来解决这个问题。
强化学习是一种试错方法,控制算法学习做出一系列决策。当它找到一个好的序列时,会得到奖励。
“这对于解决像这样的长线问题很有用。控制算法必须在一个较长的时间段内向车辆发出500条以上的加速指令。”凯茜解释说。
但还有一个额外的问题。研究人员希望该系统能够学习一种策略,减少燃料消耗,并限制对旅行时间的影响。这些目标可能相互矛盾。
“为了减少旅行时间,我们希望汽车开得快;但为了减少排放,我们希望汽车慢下来或根本不动。这些相互竞争的奖励可能会使算法出现非常困惑的情况。”凯茜说。
研究人员采用了一种被称为奖励塑造的技术来进行变通。通过奖励塑造,他们给系统一些它自己无法学习的领域知识。在这种情况下,每当车辆完全停止时,他们
交通测试
一旦研究人员开发出一种有效的控制算法,他们就使用一个具有单一交叉口的交通模拟平台对其进行评估。
该控制算法被应用于一个由联网的自动驾驶车辆组成的车队,这些车辆可以与即将到来的交通信号灯进行通信,以接收信号灯的变化和时间信息,并观察周围环境。这个算法告诉每辆车如何加速和减速。
在模拟中,系统并没有在车辆接近十字路口时造成时走时停的路况。(时走时停的路况是指由于前面的车辆被信号灯中止,后续车辆被迫完全停止行驶。)
如果路上的每辆车都是自动驾驶的,他们的控制系统可以将油耗降低18%,二氧化碳排放量降低25%,同时将行驶速度提高20%。
“一次干预能够出现20%-25%的燃料或排放减少,真的令人难以置信。但我觉得有趣的是,也是我真正希望看到的,是这种非线性的比例。”凯茜说,“这意味着我们不必等到实现100%的自动驾驶车队之后才能从这种方法中获益。”
接下来,研究人员希望研究多个交叉口之间的互动效应。他们还计划探索不同的交叉口设置(车道数量、信号灯、计时等)如何影响行驶时间、排放和燃料消耗。
此外,他们还将研究
虽然这项工作仍处于早期阶段,但凯茜认为这种方法在不远的未来可以实施。
她说:“这项工作的目的是在可持续交通方面取得进展。我们也想做梦,但这些系统是惯性的大怪物。确定干预点,对系统进行微小的改变,都会出现重大影响。”
卡内基梅隆大学电气和计算机工程系教授奥赞·通古兹(Ozan Tonguz)尽管没有参与研究,但是他认为这个项目显示了生态驾驶如何为减少燃料消耗提供一个统一的框架,从而最大限度地减少二氧化碳排放,同时在平均旅行时间上取得不错的成效。
更具体地说,本次研究中所追求的强化学习方法,通过利用联网自动驾驶汽车技术,为同一领域的其他研究人员提供了一个可行的、有吸引力的框架。
通古兹认为,在这个新兴的重要研究领域,这是一个非常及时的贡献。
本文由汽车商业评论原创出品
转载或内容合作请联系说明
违规转载必究
违规转载必究