盖世汽车讯 从机器人技术、医学再到政治学,各个领域都在尝试训练人工智能(AI)系统做出各种有意义的决策。例如,在拥堵的城市中使用AI系统智能控制交通,可以帮助驾车者更快到达目的地,同时提高安全性或可持续性。
(图片来源:麻省理工学院)
然而,教AI系统做出正确的决策并非易事。这些AI决策系统的基础是强化学习模型,当被训练执行的任务出现哪怕很小的变化时,它们仍然经常失败。以交通为例,一个模型可能难以控制一组交叉路口(具有不同的速度限制、车道数量或交通模式)。
据外媒报道,为了提高强化学习模型的可靠性,以应对具有可变性的复杂任务,麻省理工学院(MIT)的研究人员引入一种更有效的算法来训练它们。
该算法策略性选择最佳任务来训练AI代理,以使其能够有效执行相关任务集合中的所有任务。在进行交通信号控制的情况下,每个任务可以是任务空间(包括城市中的所有交叉路口)中的一个交叉口。
通过关注最有益于算法整体有效性的少数交叉路口,该方法可以充分提高性能,同时保持低训练成本。研究人员发现,在一系列仿真任务中,这种技术比标准方法的效率高5-50倍。这有助于该算法以更快的方式学习更好的解决方案,最终提高AI代理的性能。研究人员Cathy Wu表示:“通过跳出框框思考,使用非常简单的算法,我们看到惊人的性能提升。社区更可能采用不太复杂的算法,因为它更容易实施,也更容易被其他人理解。”
*特别声明:本文为技术类文章,禁止转载或大篇幅摘录!违规转载,法律必究。
本文地址:https://auto.gasgoo.com/news/202411/28I70411826C601.shtml
 
联系邮箱:info@gasgoo.com
客服QQ:531068497
求职应聘:021-39197800-8035
新闻热线:021-39586122
商务合作:021-39586681
市场合作:021-39197800-8032
研究院项目咨询:021-39197921
版权所有2011|未经授权禁止复制或建立镜像,否则将追究法律责任。
增值电信业务经营许可证 沪B2-2007118 沪ICP备07023350号