案例研究：使用神经网络控制器验证自动赛车的安全性

作者信息和声明

HSCC’20：第23届混合动力系统国际会议论文集：计算与控制2020年4月条款编号：28第1-7页https://doi.org/10.1145/3365365.3382216

出版：2020年4月22日出版历史

HSCC’20：第23届混合系统国际会议论文集：计算与控制

第1-7页

摘要

本文描述了一个使用神经网络控制器的自动赛车验证案例研究。尽管最近提出了几种验证方法，但它们仅在低维系统或具有约束环境的系统上进行了评估。为了探索现有方法的局限性，我们提出了一个具有挑战性的基准，其中神经网络将原始激光雷达测量值作为汽车转向的输入和输出。我们使用强化学习（RL）训练了十几个NN，并表明最先进的验证技术可以处理大约40条激光雷达射线的系统。此外，我们还进行了实际实验，以研究验证相对于sim2real差距的好处和局限性，即系统的建模性能和实际性能之间的差异。我们确定与建模环境类似的情况，其中验证与安全行为密切相关。最后，我们举例说明了可用于开发鲁棒和安全RL算法的LiDAR故障模式。

工具书类

【未注明日期】。F1/10自动赛车比赛。http://f1tenth.org。谷歌学者
拉杰夫·阿鲁尔。2011.混合系统的正式验证。在嵌入式软件（EMSOFT），2011年国际会议论文集。IEEE，273--278。谷歌学者数字图书馆
R.Alur、C.Courcoubetis、N.Halbwachs、T.A.Henzinger、P.H.Ho、X.Nicollin、A.Olivero、J.Sifakis和S.Yovine。1995年。混合系统的算法分析。理论计算机科学138, 1 (1995), 3--34.谷歌学者
美国国家运输安全委员会。【未注明日期】。公路HWY18MH010初步报告。https://www.ntsb.gov/investigations/AccidentReports/Reports/HWY18MH010-prelim.pdf。谷歌学者
Mariusz Bojarski、Davide Del Testa、Daniel Dworakowski、Bernhard Firner、Beat Flepp、Prasoon Goyal、Lawrence D Jackel、Mathew Monfort、Urs Muller、Jiakai Zhang等，2016年。针对自动驾驶汽车的端到端学习。arXiv预打印arXiv:1604.07316(2016).谷歌学者
叶夫根·切博塔（Yevgen Chebotar）、安库尔·汉达（Ankur Handa）、维克托·马科维丘克（Viktor Makoviychuk）、迈尔斯·麦克林（Miles Macklin）、扬·伊斯萨克（Jan Issac）、内森·拉特利夫（Nathan Ratli。2019.结束模拟到真实的循环：根据真实世界的经验调整模拟随机化。在2019年机器人与自动化国际会议（ICRA）。IEEE，8973-8979。谷歌学者数字图书馆
X.Chen、E.ábrahám和S.Sankaranarayanan。2013年流量^*：非线性混合系统分析仪。在计算机辅助核查国际会议。施普林格，258-263。谷歌学者
劳伦特·多恩（Laurent Doyen）、戈兰·弗雷斯（Goran Frehse）、乔治·帕帕斯（George J Pappas）和安德烈·普拉泽（AndréPlatzer）。2018.混合系统验证。在模型检查手册。施普林格，1047-1110。谷歌学者
Souradeep Dutta、Xin Chen和Sriram Sankaranarayanan。2019.使用回归多项式规则推理的神经反馈系统可达性分析。在第22届ACM混合系统国际会议论文集：计算与控制。美国医学会，157--168。谷歌学者数字图书馆
S.Dutta、S.Jha、S.Sankaranarayanan和A.Tiwari，2018年。深度前馈神经网络的输出范围分析。在NASA正式方法研讨会。施普林格，121-138。谷歌学者
R.埃勒斯。2017.分段线性前馈神经网络的正式验证。在核查和分析自动化技术国际研讨会。施普林格，269--286。谷歌学者交叉引用
Chelsea Finn和Sergey Levine。2017.规划机器人运动的深度视觉预见。在2017年IEEE机器人与自动化国际会议（ICRA）。IEEE，2786--2793。谷歌学者数字图书馆
Scott Fujimoto、Herke van Hoof和David Meger。2018.解决actor-critic方法中的函数近似错误。arXiv预打印arXiv:1802.09477(2018).谷歌学者
Gu Shixiang、Timothy Lillicrap、Ilya Sutskever和Sergey Levine。2016.持续深入的q-学习，基于模型的加速。在机器学习国际会议。2829--2838.谷歌学者数字图书馆
拉多斯拉夫·伊万诺夫（Radoslav Ivanov）、詹姆斯·魏默（James Weimer）、拉杰夫·阿鲁尔（Rajeev Alur）、乔治·帕帕斯（George J Pappas）和因苏普·李（Insup Lee）。2019.Verisig：使用神经网络控制器验证混合系统的安全特性。在第22届ACM混合系统国际会议论文集：计算与控制。美国医学会，169--178。谷歌学者数字图书馆
K.D.Julian、J.Lopez、J.S.Brush、M.P.Owen和M.J.Kochenderfer。2016年。飞机防撞系统的政策压缩。在数字航空电子系统会议（DASC），2016 IEEE/AIAA第35届。IEEE，1-10。谷歌学者
G.Katz、C.Barrett、D.L.Dill、K.Julian和M.J.Kochenderfer。2017.Reluplex：用于验证深层神经网络的高效SMT解算器。在计算机辅助核查国际会议。施普林格，97-117。谷歌学者
S.Kong、S.Gao、W.Chen和E.Clarke，2015年。d范围：Δ-混合系统可达性分析。在用于系统构建和分析的工具和算法国际会议。斯普林格，200-205。谷歌学者
G.Lafferiere、G.J.Pappas和S.Yovine。1999.一类新的可判定混合系统。在混合系统国际研讨会：计算与控制。137--151.谷歌学者数字图书馆
T.P.Lillicrap、J.J.Hunt、A.Pritzel、N.Heess、T.Erez、Y.Tassa、D.Silver和D.Wierstra。2015年，通过深度强化学习进行持续控制。arXiv预打印arXiv:1509.02971(2015).谷歌学者
V.Mnih、K.Kavukcuoglu、D.Silver、A.A.Rusu、J.Veness、M.G.Bellemare、A.Graves、M.Riedmiller、A.K.Fidjeland、G.Ostrovski等人，2015年。通过深度强化学习进行人性化控制。自然518, 7540 (2015), 529.谷歌学者
菲利普·波拉克（Philip Polack）、弗洛伦特·阿尔奇（Florent Altché）、布丽吉特·安德烈（Brigitte d’Andraéa Novel）和阿尔诺·德·拉福特勒（Arnaud de La Fortelle）。2017年。运动自行车模型：规划自动驾驶车辆可行轨迹的一致模型？。在2017年IEEE智能车辆研讨会（IV）。IEEE，812--818。谷歌学者交叉引用
拉杰什·拉贾马尼。2011车辆动力学和控制。施普林格科技与商业媒体。谷歌学者
罗伯特·萨金特（Robert G Sargent）。2010.仿真模型的验证和确认。在2010年冬季模拟会议记录。IEEE，166-183。谷歌学者交叉引用
D.Silver、A.Huang、C.J.Maddison、A.Guez等人，2016年。通过深度神经网络和树搜索掌握围棋游戏。自然529, 7587 (2016), 484.谷歌学者
孙晓武（Xiaowu Sun）、海塔姆·凯德（Haitham Khedr）和亚瑟·舒克里（Yasser Shoukry）。2019.神经网络控制自治系统的正式验证。在第22届ACM混合系统国际会议论文集：计算与控制。美国医学会，147-156。谷歌学者数字图书馆
C.Szegedy、W.Zaremba、I.Sutskever、J.Bruna、D.Erhan等人，2013年。神经网络的有趣特性。arXiv预打印arXiv:1312.6199(2013).谷歌学者
Hoang-Dung Tran、Feiyang Cai、Manzanas Lopez Diego、Patrick Musau、Taylor T Johnson和Xenofon Koutsoukos。2019.使用强化学习控制对网络物理系统进行安全验证。ACM嵌入式计算系统交易（TECS）18、5s（2019）、105。谷歌学者数字图书馆
王世奇、裴可欣、贾斯汀·怀特豪斯、杨俊峰和苏曼·贾纳。2018年。神经网络的有效正式安全分析。在神经信息处理系统的进展。第6367页至第6377页。谷歌学者
徐伟翁、张欢、陈红歌、赵松、谢卓奎、卢卡·丹尼尔、段伯宁和英德尔吉特·迪伦。2018.ReLU网络认证鲁棒性的快速计算。在机器学习国际会议。5273--5282.谷歌学者

索引术语

案例研究：使用神经网络控制器验证自动赛车的安全性

建议

Verisig：用神经网络控制器验证混合系统的安全特性
HSCC’19：第22届ACM混合系统国际会议论文集：计算与控制

本文提出了一种用神经网络作为控制器来验证闭环系统安全性的混合系统方法Verisig。我们将重点放在基于sigmoid的网络上，并利用sigmoid是二次型网络的解这一事实。。。
阅读更多信息
可扩展定量神经网络分析案例
SE4SafeML 2023：第一届含机器学习部件的安全关键系统可靠性和可信度国际研讨会会议记录

神经网络是一种越来越常用的工具，用于解决需要复杂分析和模式匹配的问题，例如识别自动驾驶汽车中的停车标志或在诊断过程中处理医学图像。因此，……的验证。。。
阅读更多信息
基于区间加权的神经网络抽象验证
计算机的安全性、可靠性和安全性。SAFECOMP 2022研讨会
摘要
近年来，神经网络（NNs）已经取得了很大的成熟度和效率，其应用已经扩展到各个领域，包括安全关键系统的一些模块。另一方面，最近的研究表明，神经网络。。。
阅读更多信息

登录选项

请检查您是否可以通过登录凭据或您的机构访问此文章以获得完全访问权限。

完全访问权限

获取此出版物

发布于
HSCC’20：第23届混合系统国际会议论文集：计算与控制
2020年4月
324页
十亿英镑：9781450370189
内政部：10.1145/3365365
课程主席：
亚伦·艾姆斯
加州理工学院
,
桑吉特·塞希亚
加州大学伯克利分校
,
出版物主席：
Jyotirmoy Deshmukh公司
南加州大学
版权所有©2020 ACM
如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。向请求权限[电子邮件保护].
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2020年4月22日
权限
请求有关此文章的权限。
请求权限

检查更新
徽章
- 再现结果/v1.1
作者标记
F1/10赛车
学习控制
神经网络验证
限定符
- 短纸
会议

验收费率
总体验收率153属于373提交文件，41%
资金来源
其他指标
查看文章指标

文章指标
- 32
  引文总数
  查看引文
- 1,719
  总下载次数
- 下载次数（过去12个月）351
- 下载量（最近6周）53
其他指标
查看作者指标
引用人
查看全部

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

案例研究：使用神经网络控制器验证自动赛车的安全性

HSCC’20：第23届混合系统国际会议论文集：计算与控制

摘要

工具书类

引用人

索引术语

建议

Verisig：用神经网络控制器验证混合系统的安全特性

可扩展定量神经网络分析案例

基于区间加权的神经网络抽象验证

评论