文件Zbl 1521.93054-zbMATH Open

学习具有屏障证书的安全神经网络控制器。（英语） Zbl 1521.93054号

正式Asp。计算。 33，第3期，437-455（2021年）.

MSC公司：

93亿B50	合成问题
93D20型	控制理论中的渐近稳定性
68T07型	人工神经网络与深度学习

关键词：

连续动力系统;控制器综合;神经网络;安全验证;障碍物证书

软件：

验证;nn控制器;NNV公司;安全健身房;Reluplex公司;RSOLVER公司;基准;HSolver公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	Ames AD、Coogan S、Egerstedt M、Notomista G、Sreenath K、Tabuada P（2019）《控制屏障功能：理论与应用》。2019年第18届欧洲控制会议（ECC），第3420-3431页
[2]	Ahmadi M，Singletary A，Burdick JW，Ames AD（2019）通过离散时间屏障函数在多智能体POMDP中进行安全策略合成。2019年IEEE第58届决策与控制会议（CDC）。IEEE，第4797-4803页
[3]	Berkenkamp F、Turchetta M、Schoellig AP、Krause A（2017）基于安全模型的强化学习，具有稳定性保证。摘自：第31届神经信息处理系统国际会议论文集，NIPS’17。Curran Associates Inc.，美国纽约州Red Hook，第908-919页
[4]	Choi J、Fernando C、Tomlin CJ、Sreenath K（2020），模型不确定性下安全关键控制的强化学习，使用控制Lyapunov函数和控制屏障函数。https://arxiv.org/abs/2004.07584
[5]	Cheng R、Orosz G、Murray RM、Burdick JW（2019）通过屏障功能实现安全关键连续控制任务的端到端安全强化学习。参加：第三十三届AAAI人工智能会议，2019年。美国夏威夷火奴鲁鲁AAAI出版社，2019年1月27日至2月1日，第3387-3395页
[6]	Chang Y-C，Roohi N，Gao S（2019）神经lyapunov控制。主题：神经信息处理系统的进展32。Curran Associates Inc.，第3245-3254页
[7]	Duan Y，Chen X，Houthooft R，Schulman J，Abbeel P（2016）《持续控制的深度强化学习基准测试》。摘自：《第33届机器学习国际会议论文集》，2016年6月19日至24日，美国纽约州纽约市，ICML 2016，JMLR研讨会和会议记录第48卷，第1329-1338页。JMLR.org网站
[8]	Dutta S，Chen X，Sankaranarayanan S（2019）使用回归多项式规则推理的神经反馈系统可达性分析。摘自：第22届ACM混合系统国际会议论文集：计算与控制，HSCC，第157-168页·Zbl 07120151号
[9]	Dreossi T、Fremont DJ、Ghosh S、Kim E、Ravanbakhsh H、Vazquez-Chanlatte M、Seshia SA（2019）《验证AI：基于人工智能系统的正式设计和分析工具包》。In：计算机辅助验证。施普林格国际出版公司，第432-442页
[10]	戴，L。；甘·T。；Xia，B。；Zhan，N.，重审屏障证书。《符号计算杂志》，80，62-86（2017）·Zbl 1357.68110号 ·doi:10.1016/j.jsc.2016.07.010
[11]	Dutta S、Jha S、Sankaranarayanan S、Tiwari A（2018）使用前馈神经网络学习和验证反馈控制系统。IFAC-PapersOnLine 51（16）：151-156。2018年第六届IFAC混合动力系统ADHS分析与设计会议
[12]	Dutta S、Jha S、Sankaranarayanan S、Tiwari A（2018）深度前馈神经网络的输出范围分析。在：美国国家航空航天局的正式方法。施普林格国际出版公司，第121-138页
[13]	Deshmukh JV、Kapinski J、Yamaguchi T、Prokhorov D（2019）学习具有安全保证的动态系统的深度神经网络控制器：邀请论文。2019年IEEE/ACM计算机辅助设计国际会议（ICCAD），第1-7页
[14]	Fulton N，Platzer A（2018）通过正式方法进行安全强化学习：通过证明和学习实现安全控制。在：第三十二届AAAI人工智能会议论文集，（AAAI-18）。美国路易斯安那州新奥尔良AAAI出版社，2018年2月2-7日，第6485-6492页
[15]	古德费罗，I。；Y.本吉奥。；A.Courville，《深度学习》（2016），麻省理工学院出版社·Zbl 1373.68009号
[16]	Hespanha JP（2018）线性系统理论。普林斯顿大学出版社，第二版·Zbl 1381.93001号
[17]	Ivanov R、Carpenter TJ、Weimer J、Alur R、Pappas GJ、Lee I（2020）案例研究：使用神经网络控制器验证自动赛车的安全性。摘自：HSCC’20:第23届ACM混合系统国际会议：计算与控制，澳大利亚新南威尔士州悉尼，2020年4月21日至24日。ACM，第28:1-28:7页·Zbl 07300869号
[18]	Ivanov R、Weimer J、Alur R、Pappas GJ、Lee I（2019）Verisig：用神经网络控制器验证混合系统的安全特性。摘自：第22届ACM混合系统国际会议论文集：计算与控制，HSCC 2019。第169-178页·Zbl 07120152号
[19]	Jordan M，Dimakis AG（2020）精确计算ReLU网络的局部Lipschitz常数。https://arxiv.org/abs/2003.01219
[20]	Katz G、Barrett C、Dill DL、Julian K、Kochenderfer MJ（2017）Reluplex：用于验证深层神经网络的高效smt求解器。参加：计算机辅助验证国际会议。施普林格，第97-117页·Zbl 1494.68167号
[21]	Kong H，He F，Song X，Hung WNN，Gu M（2013）混合系统安全验证的指数条件屏障证书生成。摘自：第25届计算机辅助验证国际会议记录。施普林格，第242-257页·Zbl 1357.68113号
[22]	Lillicrap TP、Hunt JJ、Pritzel A、Heess N、Erez T、Tassa Y、Silver D、Wierstra D（2016）《持续控制与深度强化学习》。在：第四届学习表征国际会议，ICLR 2016，波多黎各圣胡安，2016年5月2-4日，会议记录
[23]	Leshno，M。；林，VY；Pinkus，A。；Schocken，S.，具有非多项式激活函数的多层前馈网络可以近似任何函数，Neural Netw，6，6，861-867（1993）·doi:10.1016/S0893-6080（05）80131-5
[24]	Li J，Liu J，Yang P，Chen L，Huang X，Zhang L（2019）用符号传播分析深层神经网络：朝着更高精度和更快验证的方向发展。In：静态分析。施普林格国际出版公司，第296-319页
[25]	Mittal M，Gallieri M，Quaglino A，Salehian SSM，Koutník J（2020）神经lyapunov模型预测控制。https://arxiv.org/abs/2002.10451
[26]	Nguyen T，Antonopoulos T，Ruef A，Hicks M（2017）寻找数值不变量的反例引导方法。参见：2017年第11次软件工程基础联合会议记录，ESEC/FSE 2017。美国纽约州纽约市计算机协会，第605-615页
[27]	Peruffo A，Ahmed D，Abate A（2020）用于动态模型的神经屏障证书的自动和正式合成。https://arxiv.org/abs/2007.03251 ·Zbl 1467.68091号
[28]	波兹尼亚克，A。；桑切斯，EN；Yu，W.，鲁棒非线性控制的微分神经网络（2001），世界科学·Zbl 1060.93006号 ·数字对象标识代码：10.1142/4703
[29]	Prajna，S。；Jadbabaie，A。；Pappas，GJ，使用屏障证书进行最坏情况和随机安全验证的框架，IEEE Trans-Autom Control，52，8，1415-1429（2007）·Zbl 1366.93711号 ·doi:10.10109/TAC.2007.902736
[30]	Pulina L，Taccella A（2010）人工神经网络验证的一种抽象再细化方法。In：计算机辅助验证，第243-257页
[31]	Ray A、Achiam J、Amodei D（2019）《深度强化学习中的安全探索基准》。https://cdn.openai.com/safexp-short.pdf
[32]	Ratschan，S.，安全和屏障证书的逆向定理，IEEE Trans-Autom Control，63，8，2628-2632（2018）·Zbl 1423.93107号 ·doi:10.1109/TAC.2018.2792325
[33]	Richards SM、Berkenkamp F、Krause A（2018）李亚普诺夫神经网络：动态系统安全学习的自适应稳定性证明。http://arxiv.org/abs/1808.00924
[34]	Ratschan，S。；She，Z.，通过基于约束传播的抽象求精对混合系统进行安全验证，ACM跨嵌入式计算系统，6，1，1-23（2007）·doi:10.1145/1210268.1210276
[35]	Ratschan，S。；She，Z.，通过计算类Lyapunov函数为多项式系统的目标区域提供吸引域，SIAM J Control Optim，48，7，4377-4394（2010）·兹比尔1215.65188 ·doi:10.1137/090749955
[36]	拉文巴赫，H。；Sankaranarayanan，S.，从反例和演示中学习控制Lyapunov函数，Auton Robots，43，2，275-307（2019）·doi:10.1007/s10514-018-9791-9
[37]	Sogokon A、Ghorbal K、Tan YK、Platzer A（2018）《病媒屏障证书和比较系统》。In：形式方法，第418-437页·Zbl 1460.93012号
[38]	Sun X，Khedr H，Shoukry Y（2019）神经网络控制自治系统的形式验证。在：第22届ACM混合系统国际会议论文集：计算与控制，HSCC 2019。第147-156页·Zbl 07120150号
[39]	She Z，Li M（2020）进化函数级数表示的可达集的过逼近和欠逼近。IEEE Trans Autom控制·兹伯利07352095
[40]	Sloth C、Pappas GJ、Wisniewski R（2012）《使用屏障证书的成分安全分析》。In：混合系统程序：计算和控制（HSCC）。ACM，第15-24页·Zbl 1362.68185号
[41]	Taylor AJ、Dorobantu VD、Le Hoang M、Yue Y、Ames AD（2019）不确定机器人系统的控制Lyapunov函数情景学习。2019年IEEE/RSJ智能机器人和系统（IROS）国际会议，第6878-6884页
[42]	Telgarsky M（2017）神经网络和有理函数。摘自：第34届国际机器学习会议记录——第70卷，ICML’17，第3387-3393页。JMLR.org网站
[43]	Tuncali CE、Kapinski J、Ito H、Deshmukh JV（2018）受邀：关于自主网络物理系统中学习型组件安全性的推理。参加：2018年第55届ACM/ESDA/IEEE设计自动化会议（DAC），第1-6页
[44]	Taylor A、Singletary A、Yue Y、Ames A（2019）《学习使用控制屏障功能进行安全关键控制》。https://arxiv.org/abs/1912.10099
[45]	Tran H-D、Yang X、Lopez DM、Musau P、Nguyen LV、Xiang W、Bak S、Johnson TT（2020）NNV：深层神经网络和学习型网络物理系统的神经网络验证工具。In：计算机辅助验证。施普林格国际出版公司，第3-17页
[46]	Wisniewski，R。；Sloth，C.，匡威屏障证明定理，IEEE Trans-Autom Control，61，5，1356-1361（2016）·Zbl 1359.93130号 ·doi:10.1109/TAC.2015.2476155
[47]	Weng T-W，Zhang H，Chen H，Song Z，Hsieh C-J，Daniel L，Boning DS，Dhillon IS（2018）relu网络认证鲁棒性的快速计算。摘自：第35届机器学习国际会议记录，ICML 2018，第5273-5282页
[48]	Xiang，W。；Tran，H-D；Johnson，TT，多层神经网络的输出可达集估计和验证，IEEE跨神经网络学习系统，29，11，5777-5783（2018）·doi:10.1109/TNNLS.2018.2808470
[49]	Yaghoubi S、Fainekos G、Sankaranarayanan S（2020）在存在干扰的情况下使用控制屏障功能训练神经网络控制器。https://arxiv.org/abs/2001.08088
[50]	Zhu H，Xiong Z，Magill S，Jagannathan S（2019）《可验证强化学习的归纳综合框架》。摘自：第40届ACM SIGPLAN编程语言设计与实现会议记录，PLDI 2019。美国纽约州纽约市计算机协会，第686-701页
[51]	Zhao H，Zeng X，Chen T，Liu Z，Woodcock J（2020）学习具有屏障证书的安全神经网络控制器。专业：可靠软件工程。理论、工具和应用。施普林格国际出版社，商会，第177-185页·Zbl 1503.93022号
[52]	Zhao H，Zeng X，Chen T，Liu Z（2020）使用神经网络合成屏障证书。In:HSCC’20。ACM，第25:1-25:11页·兹伯利07300866

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

学习具有屏障证书的安全神经网络控制器。（英语） Zbl 1521.93054号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

学习具有屏障证书的安全神经网络控制器。 （英语） Zbl 1521.93054号

MSC公司：

关键词：

软件：

参考文献：

学习具有屏障证书的安全神经网络控制器。（英语） Zbl 1521.93054号