跳到主要内容
10.1145/3365365.3382216acm会议文章/章节视图摘要出版物页面cpsweek公司会议记录会议集合
短纸
公共访问
再现结果/v1.1

案例研究:使用神经网络控制器验证自动赛车的安全性

出版:2020年4月22日出版历史

摘要

本文描述了一个使用神经网络控制器的自动赛车验证案例研究。尽管最近提出了几种验证方法,但它们仅在低维系统或具有约束环境的系统上进行了评估。为了探索现有方法的局限性,我们提出了一个具有挑战性的基准,其中神经网络将原始激光雷达测量值作为汽车转向的输入和输出。我们使用强化学习(RL)训练了十几个NN,并表明最先进的验证技术可以处理大约40条激光雷达射线的系统。此外,我们还进行了实际实验,以研究验证相对于sim2real差距的好处和局限性,即系统的建模性能和实际性能之间的差异。我们确定与建模环境类似的情况,其中验证与安全行为密切相关。最后,我们举例说明了可用于开发鲁棒和安全RL算法的LiDAR故障模式。

工具书类

  1. 【未注明日期】。F1/10自动赛车比赛。http://f1tenth.org。谷歌学者谷歌学者
  2. 拉杰夫·阿鲁尔。2011.混合系统的正式验证。嵌入式软件(EMSOFT),2011年国际会议论文集。IEEE,273--278。谷歌学者谷歌学者数字图书馆数字图书馆
  3. R.Alur、C.Courcoubetis、N.Halbwachs、T.A.Henzinger、P.H.Ho、X.Nicollin、A.Olivero、J.Sifakis和S.Yovine。1995年。混合系统的算法分析。理论计算机科学138, 1 (1995), 3--34.谷歌学者谷歌学者
  4. 美国国家运输安全委员会。【未注明日期】。公路HWY18MH010初步报告。https://www.ntsb.gov/investigations/AccidentReports/Reports/HWY18MH010-prelim.pdf。谷歌学者谷歌学者
  5. Mariusz Bojarski、Davide Del Testa、Daniel Dworakowski、Bernhard Firner、Beat Flepp、Prasoon Goyal、Lawrence D Jackel、Mathew Monfort、Urs Muller、Jiakai Zhang等,2016年。针对自动驾驶汽车的端到端学习。arXiv预打印arXiv:1604.07316(2016).谷歌学者谷歌学者
  6. 叶夫根·切博塔(Yevgen Chebotar)、安库尔·汉达(Ankur Handa)、维克托·马科维丘克(Viktor Makoviychuk)、迈尔斯·麦克林(Miles Macklin)、扬·伊斯萨克(Jan Issac)、内森·拉特利夫(Nathan Ratli。2019.结束模拟到真实的循环:根据真实世界的经验调整模拟随机化。2019年机器人与自动化国际会议(ICRA)。IEEE,8973-8979。谷歌学者谷歌学者数字图书馆数字图书馆
  7. X.Chen、E.ábrahám和S.Sankaranarayanan。2013年流量*:非线性混合系统分析仪。计算机辅助核查国际会议。施普林格,258-263。谷歌学者谷歌学者
  8. 劳伦特·多恩(Laurent Doyen)、戈兰·弗雷斯(Goran Frehse)、乔治·帕帕斯(George J Pappas)和安德烈·普拉泽(AndréPlatzer)。2018.混合系统验证。模型检查手册。施普林格,1047-1110。谷歌学者谷歌学者
  9. Souradeep Dutta、Xin Chen和Sriram Sankaranarayanan。2019.使用回归多项式规则推理的神经反馈系统可达性分析。第22届ACM混合系统国际会议论文集:计算与控制。美国医学会,157--168。谷歌学者谷歌学者数字图书馆数字图书馆
  10. S.Dutta、S.Jha、S.Sankaranarayanan和A.Tiwari,2018年。深度前馈神经网络的输出范围分析。NASA正式方法研讨会。施普林格,121-138。谷歌学者谷歌学者
  11. R.埃勒斯。2017.分段线性前馈神经网络的正式验证。核查和分析自动化技术国际研讨会。施普林格,269--286。谷歌学者谷歌学者交叉引用交叉引用
  12. Chelsea Finn和Sergey Levine。2017.规划机器人运动的深度视觉预见。2017年IEEE机器人与自动化国际会议(ICRA)。IEEE,2786--2793。谷歌学者谷歌学者数字图书馆数字图书馆
  13. Scott Fujimoto、Herke van Hoof和David Meger。2018.解决actor-critic方法中的函数近似错误。arXiv预打印arXiv:1802.09477(2018).谷歌学者谷歌学者
  14. Gu Shixiang、Timothy Lillicrap、Ilya Sutskever和Sergey Levine。2016.持续深入的q-学习,基于模型的加速。机器学习国际会议。2829--2838.谷歌学者谷歌学者数字图书馆数字图书馆
  15. 拉多斯拉夫·伊万诺夫(Radoslav Ivanov)、詹姆斯·魏默(James Weimer)、拉杰夫·阿鲁尔(Rajeev Alur)、乔治·帕帕斯(George J Pappas)和因苏普·李(Insup Lee)。2019.Verisig:使用神经网络控制器验证混合系统的安全特性。第22届ACM混合系统国际会议论文集:计算与控制。美国医学会,169--178。谷歌学者谷歌学者数字图书馆数字图书馆
  16. K.D.Julian、J.Lopez、J.S.Brush、M.P.Owen和M.J.Kochenderfer。2016年。飞机防撞系统的政策压缩。数字航空电子系统会议(DASC),2016 IEEE/AIAA第35届。IEEE,1-10。谷歌学者谷歌学者
  17. G.Katz、C.Barrett、D.L.Dill、K.Julian和M.J.Kochenderfer。2017.Reluplex:用于验证深层神经网络的高效SMT解算器。计算机辅助核查国际会议。施普林格,97-117。谷歌学者谷歌学者
  18. S.Kong、S.Gao、W.Chen和E.Clarke,2015年。d范围:Δ-混合系统可达性分析。用于系统构建和分析的工具和算法国际会议。斯普林格,200-205。谷歌学者谷歌学者
  19. G.Lafferiere、G.J.Pappas和S.Yovine。1999.一类新的可判定混合系统。混合系统国际研讨会:计算与控制。137--151.谷歌学者谷歌学者数字图书馆数字图书馆
  20. T.P.Lillicrap、J.J.Hunt、A.Pritzel、N.Heess、T.Erez、Y.Tassa、D.Silver和D.Wierstra。2015年,通过深度强化学习进行持续控制。arXiv预打印arXiv:1509.02971(2015).谷歌学者谷歌学者
  21. V.Mnih、K.Kavukcuoglu、D.Silver、A.A.Rusu、J.Veness、M.G.Bellemare、A.Graves、M.Riedmiller、A.K.Fidjeland、G.Ostrovski等人,2015年。通过深度强化学习进行人性化控制。自然518, 7540 (2015), 529.谷歌学者谷歌学者
  22. 菲利普·波拉克(Philip Polack)、弗洛伦特·阿尔奇(Florent Altché)、布丽吉特·安德烈(Brigitte d’Andraéa Novel)和阿尔诺·德·拉福特勒(Arnaud de La Fortelle)。2017年。运动自行车模型:规划自动驾驶车辆可行轨迹的一致模型?。2017年IEEE智能车辆研讨会(IV)。IEEE,812--818。谷歌学者谷歌学者交叉引用交叉引用
  23. 拉杰什·拉贾马尼。2011车辆动力学和控制。施普林格科技与商业媒体。谷歌学者谷歌学者
  24. 罗伯特·萨金特(Robert G Sargent)。2010.仿真模型的验证和确认。2010年冬季模拟会议记录。IEEE,166-183。谷歌学者谷歌学者交叉引用交叉引用
  25. D.Silver、A.Huang、C.J.Maddison、A.Guez等人,2016年。通过深度神经网络和树搜索掌握围棋游戏。自然529, 7587 (2016), 484.谷歌学者谷歌学者
  26. 孙晓武(Xiaowu Sun)、海塔姆·凯德(Haitham Khedr)和亚瑟·舒克里(Yasser Shoukry)。2019.神经网络控制自治系统的正式验证。第22届ACM混合系统国际会议论文集:计算与控制。美国医学会,147-156。谷歌学者谷歌学者数字图书馆数字图书馆
  27. C.Szegedy、W.Zaremba、I.Sutskever、J.Bruna、D.Erhan等人,2013年。神经网络的有趣特性。arXiv预打印arXiv:1312.6199(2013).谷歌学者谷歌学者
  28. Hoang-Dung Tran、Feiyang Cai、Manzanas Lopez Diego、Patrick Musau、Taylor T Johnson和Xenofon Koutsoukos。2019.使用强化学习控制对网络物理系统进行安全验证。ACM嵌入式计算系统交易(TECS)18、5s(2019)、105。谷歌学者谷歌学者数字图书馆数字图书馆
  29. 王世奇、裴可欣、贾斯汀·怀特豪斯、杨俊峰和苏曼·贾纳。2018年。神经网络的有效正式安全分析。神经信息处理系统的进展。第6367页至第6377页。谷歌学者谷歌学者
  30. 徐伟翁、张欢、陈红歌、赵松、谢卓奎、卢卡·丹尼尔、段伯宁和英德尔吉特·迪伦。2018.ReLU网络认证鲁棒性的快速计算。机器学习国际会议。5273--5282.谷歌学者谷歌学者

索引术语

  1. 案例研究:使用神经网络控制器验证自动赛车的安全性

        建议

        评论

        登录选项

        请检查您是否可以通过登录凭据或您的机构访问此文章以获得完全访问权限。

        登录

        完全访问权限

        • 发布于

          封面图片ACM会议
          HSCC’20:第23届混合系统国际会议论文集:计算与控制
          2020年4月
          324页
          十亿英镑:9781450370189
          内政部:10.1145/3365365

          版权所有©2020 ACM

          如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。向请求权限[电子邮件保护].

          出版商

          计算机协会

          美国纽约州纽约市

          出版历史

          • 出版:2020年4月22日

          权限

          请求有关此文章的权限。

          请求权限

          检查更新

          限定符

          • 短纸

          验收费率

          总体验收率153属于373提交文件,41%

        PDF格式

        以PDF文件查看或下载。

        PDF格式

        电子阅读器

        使用eReader联机查看。

        电子阅读器