×

学习具有屏障证书的安全神经网络控制器。 (英语) Zbl 1521.93054号


MSC公司:

93亿B50 合成问题
93D20型 控制理论中的渐近稳定性
68T07型 人工神经网络与深度学习
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Ames AD、Coogan S、Egerstedt M、Notomista G、Sreenath K、Tabuada P(2019)《控制屏障功能:理论与应用》。2019年第18届欧洲控制会议(ECC),第3420-3431页
[2] Ahmadi M,Singletary A,Burdick JW,Ames AD(2019)通过离散时间屏障函数在多智能体POMDP中进行安全策略合成。2019年IEEE第58届决策与控制会议(CDC)。IEEE,第4797-4803页
[3] Berkenkamp F、Turchetta M、Schoellig AP、Krause A(2017)基于安全模型的强化学习,具有稳定性保证。摘自:第31届神经信息处理系统国际会议论文集,NIPS’17。Curran Associates Inc.,美国纽约州Red Hook,第908-919页
[4] Choi J、Fernando C、Tomlin CJ、Sreenath K(2020),模型不确定性下安全关键控制的强化学习,使用控制Lyapunov函数和控制屏障函数。https://arxiv.org/abs/2004.07584
[5] Cheng R、Orosz G、Murray RM、Burdick JW(2019)通过屏障功能实现安全关键连续控制任务的端到端安全强化学习。参加:第三十三届AAAI人工智能会议,2019年。美国夏威夷火奴鲁鲁AAAI出版社,2019年1月27日至2月1日,第3387-3395页
[6] Chang Y-C,Roohi N,Gao S(2019)神经lyapunov控制。主题:神经信息处理系统的进展32。Curran Associates Inc.,第3245-3254页
[7] Duan Y,Chen X,Houthooft R,Schulman J,Abbeel P(2016)《持续控制的深度强化学习基准测试》。摘自:《第33届机器学习国际会议论文集》,2016年6月19日至24日,美国纽约州纽约市,ICML 2016,JMLR研讨会和会议记录第48卷,第1329-1338页。JMLR.org网站
[8] Dutta S,Chen X,Sankaranarayanan S(2019)使用回归多项式规则推理的神经反馈系统可达性分析。摘自:第22届ACM混合系统国际会议论文集:计算与控制,HSCC,第157-168页·Zbl 07120151号
[9] Dreossi T、Fremont DJ、Ghosh S、Kim E、Ravanbakhsh H、Vazquez-Chanlatte M、Seshia SA(2019)《验证AI:基于人工智能系统的正式设计和分析工具包》。In:计算机辅助验证。施普林格国际出版公司,第432-442页
[10] 戴,L。;甘·T。;Xia,B。;Zhan,N.,重审屏障证书。《符号计算杂志》,80,62-86(2017)·Zbl 1357.68110号 ·doi:10.1016/j.jsc.2016.07.010
[11] Dutta S、Jha S、Sankaranarayanan S、Tiwari A(2018)使用前馈神经网络学习和验证反馈控制系统。IFAC-PapersOnLine 51(16):151-156。2018年第六届IFAC混合动力系统ADHS分析与设计会议
[12] Dutta S、Jha S、Sankaranarayanan S、Tiwari A(2018)深度前馈神经网络的输出范围分析。在:美国国家航空航天局的正式方法。施普林格国际出版公司,第121-138页
[13] Deshmukh JV、Kapinski J、Yamaguchi T、Prokhorov D(2019)学习具有安全保证的动态系统的深度神经网络控制器:邀请论文。2019年IEEE/ACM计算机辅助设计国际会议(ICCAD),第1-7页
[14] Fulton N,Platzer A(2018)通过正式方法进行安全强化学习:通过证明和学习实现安全控制。在:第三十二届AAAI人工智能会议论文集,(AAAI-18)。美国路易斯安那州新奥尔良AAAI出版社,2018年2月2-7日,第6485-6492页
[15] 古德费罗,I。;Y.本吉奥。;A.Courville,《深度学习》(2016),麻省理工学院出版社·Zbl 1373.68009号
[16] Hespanha JP(2018)线性系统理论。普林斯顿大学出版社,第二版·Zbl 1381.93001号
[17] Ivanov R、Carpenter TJ、Weimer J、Alur R、Pappas GJ、Lee I(2020)案例研究:使用神经网络控制器验证自动赛车的安全性。摘自:HSCC’20:第23届ACM混合系统国际会议:计算与控制,澳大利亚新南威尔士州悉尼,2020年4月21日至24日。ACM,第28:1-28:7页·Zbl 07300869号
[18] Ivanov R、Weimer J、Alur R、Pappas GJ、Lee I(2019)Verisig:用神经网络控制器验证混合系统的安全特性。摘自:第22届ACM混合系统国际会议论文集:计算与控制,HSCC 2019。第169-178页·Zbl 07120152号
[19] Jordan M,Dimakis AG(2020)精确计算ReLU网络的局部Lipschitz常数。https://arxiv.org/abs/2003.01219
[20] Katz G、Barrett C、Dill DL、Julian K、Kochenderfer MJ(2017)Reluplex:用于验证深层神经网络的高效smt求解器。参加:计算机辅助验证国际会议。施普林格,第97-117页·Zbl 1494.68167号
[21] Kong H,He F,Song X,Hung WNN,Gu M(2013)混合系统安全验证的指数条件屏障证书生成。摘自:第25届计算机辅助验证国际会议记录。施普林格,第242-257页·Zbl 1357.68113号
[22] Lillicrap TP、Hunt JJ、Pritzel A、Heess N、Erez T、Tassa Y、Silver D、Wierstra D(2016)《持续控制与深度强化学习》。在:第四届学习表征国际会议,ICLR 2016,波多黎各圣胡安,2016年5月2-4日,会议记录
[23] Leshno,M。;林,VY;Pinkus,A。;Schocken,S.,具有非多项式激活函数的多层前馈网络可以近似任何函数,Neural Netw,6,6,861-867(1993)·doi:10.1016/S0893-6080(05)80131-5
[24] Li J,Liu J,Yang P,Chen L,Huang X,Zhang L(2019)用符号传播分析深层神经网络:朝着更高精度和更快验证的方向发展。In:静态分析。施普林格国际出版公司,第296-319页
[25] Mittal M,Gallieri M,Quaglino A,Salehian SSM,Koutník J(2020)神经lyapunov模型预测控制。https://arxiv.org/abs/2002.10451
[26] Nguyen T,Antonopoulos T,Ruef A,Hicks M(2017)寻找数值不变量的反例引导方法。参见:2017年第11次软件工程基础联合会议记录,ESEC/FSE 2017。美国纽约州纽约市计算机协会,第605-615页
[27] Peruffo A,Ahmed D,Abate A(2020)用于动态模型的神经屏障证书的自动和正式合成。https://arxiv.org/abs/2007.03251 ·Zbl 1467.68091号
[28] 波兹尼亚克,A。;桑切斯,EN;Yu,W.,鲁棒非线性控制的微分神经网络(2001),世界科学·Zbl 1060.93006号 ·数字对象标识代码:10.1142/4703
[29] Prajna,S。;Jadbabaie,A。;Pappas,GJ,使用屏障证书进行最坏情况和随机安全验证的框架,IEEE Trans-Autom Control,52,8,1415-1429(2007)·Zbl 1366.93711号 ·doi:10.10109/TAC.2007.902736
[30] Pulina L,Taccella A(2010)人工神经网络验证的一种抽象再细化方法。In:计算机辅助验证,第243-257页
[31] Ray A、Achiam J、Amodei D(2019)《深度强化学习中的安全探索基准》。https://cdn.openai.com/safexp-short.pdf
[32] Ratschan,S.,安全和屏障证书的逆向定理,IEEE Trans-Autom Control,63,8,2628-2632(2018)·Zbl 1423.93107号 ·doi:10.1109/TAC.2018.2792325
[33] Richards SM、Berkenkamp F、Krause A(2018)李亚普诺夫神经网络:动态系统安全学习的自适应稳定性证明。http://arxiv.org/abs/1808.00924
[34] Ratschan,S。;She,Z.,通过基于约束传播的抽象求精对混合系统进行安全验证,ACM跨嵌入式计算系统,6,1,1-23(2007)·doi:10.1145/1210268.1210276
[35] Ratschan,S。;She,Z.,通过计算类Lyapunov函数为多项式系统的目标区域提供吸引域,SIAM J Control Optim,48,7,4377-4394(2010)·兹比尔1215.65188 ·doi:10.1137/090749955
[36] 拉文巴赫,H。;Sankaranarayanan,S.,从反例和演示中学习控制Lyapunov函数,Auton Robots,43,2,275-307(2019)·doi:10.1007/s10514-018-9791-9
[37] Sogokon A、Ghorbal K、Tan YK、Platzer A(2018)《病媒屏障证书和比较系统》。In:形式方法,第418-437页·Zbl 1460.93012号
[38] Sun X,Khedr H,Shoukry Y(2019)神经网络控制自治系统的形式验证。在:第22届ACM混合系统国际会议论文集:计算与控制,HSCC 2019。第147-156页·Zbl 07120150号
[39] She Z,Li M(2020)进化函数级数表示的可达集的过逼近和欠逼近。IEEE Trans Autom控制·兹伯利07352095
[40] Sloth C、Pappas GJ、Wisniewski R(2012)《使用屏障证书的成分安全分析》。In:混合系统程序:计算和控制(HSCC)。ACM,第15-24页·Zbl 1362.68185号
[41] Taylor AJ、Dorobantu VD、Le Hoang M、Yue Y、Ames AD(2019)不确定机器人系统的控制Lyapunov函数情景学习。2019年IEEE/RSJ智能机器人和系统(IROS)国际会议,第6878-6884页
[42] Telgarsky M(2017)神经网络和有理函数。摘自:第34届国际机器学习会议记录——第70卷,ICML’17,第3387-3393页。JMLR.org网站
[43] Tuncali CE、Kapinski J、Ito H、Deshmukh JV(2018)受邀:关于自主网络物理系统中学习型组件安全性的推理。参加:2018年第55届ACM/ESDA/IEEE设计自动化会议(DAC),第1-6页
[44] Taylor A、Singletary A、Yue Y、Ames A(2019)《学习使用控制屏障功能进行安全关键控制》。https://arxiv.org/abs/1912.10099
[45] Tran H-D、Yang X、Lopez DM、Musau P、Nguyen LV、Xiang W、Bak S、Johnson TT(2020)NNV:深层神经网络和学习型网络物理系统的神经网络验证工具。In:计算机辅助验证。施普林格国际出版公司,第3-17页
[46] Wisniewski,R。;Sloth,C.,匡威屏障证明定理,IEEE Trans-Autom Control,61,5,1356-1361(2016)·Zbl 1359.93130号 ·doi:10.1109/TAC.2015.2476155
[47] Weng T-W,Zhang H,Chen H,Song Z,Hsieh C-J,Daniel L,Boning DS,Dhillon IS(2018)relu网络认证鲁棒性的快速计算。摘自:第35届机器学习国际会议记录,ICML 2018,第5273-5282页
[48] Xiang,W。;Tran,H-D;Johnson,TT,多层神经网络的输出可达集估计和验证,IEEE跨神经网络学习系统,29,11,5777-5783(2018)·doi:10.1109/TNNLS.2018.2808470
[49] Yaghoubi S、Fainekos G、Sankaranarayanan S(2020)在存在干扰的情况下使用控制屏障功能训练神经网络控制器。https://arxiv.org/abs/2001.08088
[50] Zhu H,Xiong Z,Magill S,Jagannathan S(2019)《可验证强化学习的归纳综合框架》。摘自:第40届ACM SIGPLAN编程语言设计与实现会议记录,PLDI 2019。美国纽约州纽约市计算机协会,第686-701页
[51] Zhao H,Zeng X,Chen T,Liu Z,Woodcock J(2020)学习具有屏障证书的安全神经网络控制器。专业:可靠软件工程。理论、工具和应用。施普林格国际出版社,商会,第177-185页·Zbl 1503.93022号
[52] Zhao H,Zeng X,Chen T,Liu Z(2020)使用神经网络合成屏障证书。In:HSCC’20。ACM,第25:1-25:11页·兹伯利07300866
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。