×

训练分类器进行反馈控制,同时考虑安全性。 (英语) Zbl 1461.93162号

摘要:许多自主系统的传感器提供高维和信息丰富的测量。系统状态是该信息的一部分,但从此类测量中提取该信息具有挑战性。在没有状态知识的情况下,自治系统不能使用传统的反馈控制算法。我们提出了用于分析和综合支持分类器的控制体系结构的计算算法。我们展示了如何基于与从数据中学习相关的标准来训练分类器所得闭环系统的特性。推导这些算法的方法包括将所得闭环系统建模为分段仿射微分包含。该训练方法基于投影梯度下降算法。将该方法应用于移动机器人的导航问题,证明了该方法的能力。

MSC公司:

第93页第52页 反馈控制
93C85号 控制理论中的自动化系统(机器人等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alpaydin,E.,《机器学习导论》(2010),麻省理工学院出版社·Zbl 1191.68485号
[2] Berkenkamp,F.、Turchetta,M.、Schoellig,A.P.和Krause,A.(2017)。基于安全模型的强化学习,具有稳定性保证。2017年神经信息处理系统年度会议(第908-919页)。
[3] Blanchini,F.,鲁棒控制的非二次Lyapunov函数,Automatica,31,3451-461(1995)·Zbl 0825.93653号
[4] Bojarski,M。;Testa,D.D。;德沃拉科夫斯基,D。;Firner,B。;弗莱普,B。;Goyal,P.,《自动驾驶汽车的端到端学习》(2016年)
[5] 博伊德,S。;Parikh,北。;朱,E。;佩莱托,B。;Eckstein,J.,通过乘数的交替方向方法进行分布式优化和统计学习,机器学习的基础和趋势,3,1,1-122(2011)·Zbl 1229.90122号
[6] Chen,T。;Guestrin,C.,XGBoost:一个可扩展的树增强系统,(第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2016),ACM:美国纽约州纽约市ACM),785-794
[7] Chua,L.O。;邓,A.-C.,规范分段线性表示,IEEE电路与系统汇刊,35,1,101-111(1988)·Zbl 0644.94023号
[8] Cortes,J.,《不连续动力系统》,IEEE控制系统杂志,28,3,36-73(2008)·Zbl 1395.34023号
[9] 科尔特斯,C。;Vapnik,V.,支持向量网络,机器学习,20,3,273-297(1995)·Zbl 0831.68098号
[10] Filippov,A.F。;Arscott,F.M.,(不连续右手边微分方程。不连续右手侧微分方程,数学及其应用(1988))·Zbl 0664.34001号
[11] 费萨克,J。;Akametalu,A.K。;Zeilinger,M.N。;Kaynama,S。;Gillula,J。;Tomlin,C.J.,《不确定机器人系统中基于学习的控制的一般安全框架》,IEEE自动控制汇刊,1(2018)
[12] Flynn,A.,将声纳和红外传感器结合用于移动机器人导航,《国际机器人研究杂志》,7,6,5-14(1988)
[13] Gale,D.,线性经济模型理论(1960),McGraw-Hill:McGraw-Hill纽约·Zbl 0114.12203号
[14] Ghosh,S。;Mercier,A。;Pichapati,D。;Jha,S。;Yegneswaran,V。;Lincoln,P.,安全约束自主控制的可信神经网络(2018)
[15] Giusti,A。;J.古兹。;西里桑特区。;他,F.-L。;罗德里格斯,J.P。;Fontana,F.,移动机器人森林小径视觉感知的机器学习方法,IEEE机器人与自动化快报,1,2661-667(2016)
[16] Gorski,J。;普菲弗。;Klamroth,K.,双凸集和双凸函数优化:综述和扩展,运筹学数学方法,373-407(2007)·Zbl 1146.90495号
[17] 哈斯蒂,T。;蒂布希拉尼,R。;Friedman,J.,《统计学习、数据挖掘、干扰和预测的要素》(2009),施普林格出版社·Zbl 1273.62005年
[18] Hertneck,M。;科勒,J。;Trimpe,S.公司。;Allgöwer,F.,学习具有保证的近似模型预测控制器,IEEE Control Systems Letters,2,3,543-548(2018)
[19] Hutchinson,S.(2010年)。基于视觉的机器人运动控制。计算机科学讲义:第6419卷。模式识别、图像分析、计算机视觉和应用方面的进展。
[20] 伊万诺夫·R。;韦默,J。;阿鲁尔(Alur,R.)。;帕帕斯,G.J。;Lee,I.,Verisig:用神经网络控制器验证混合系统的安全特性,(第22届ACM混合系统国际会议论文集:计算与控制(2019年),ACM:美国纽约州纽约市ACM),169-178·Zbl 07120152号
[21] Johansson,M.,分段线性控制系统,199(1999),隆德大学隆德理工学院(LTH)自动控制系,TFRT-1052
[22] Krizhevsky,A。;Sutskever,I。;Hinton,G.E.,用深度卷积神经网络进行ImageNet分类,(Pereira,F.;Burges,C.J.C.;Bottou,L.;Weinberger,K.Q.,《神经信息处理系统进展》(第25卷)(2012年),Curran Associates,Inc),1097-1105
[23] Li,Y.和Olson,E.B.(2010年)。从激光雷达数据中提取通用特征。2010年IEEE机器人与自动化国际会议(第1388-1393页)。
[24] Mangasarian,O.L.,(非线性规划,非线性规划,应用数学经典(1994),工业和应用数学学会)·Zbl 0833.90108号
[25] Nesterov,Y.,《凸优化导论:基础课程》(第87卷)(2013年),Springer Science&Business Media
[26] Poonawala,H.A.、Lauffer,N.和Topcu,U.(2019年)。训练分类器进行反馈控制。2019年美国控制会议(第4961-4967页)。
[27] Poonawala,H.A.和Topcu,U.(2017年)。分类器在上控制系统的鲁棒性:一种混合系统方法。2017年IEEE第56届决策与控制年会(第2738-2743页)。
[28] 拉马纳戈帕尔,M.S。;安德森,C。;瓦苏德万,R。;Johnson-Roberson,M.,《学习失败:自动识别自动驾驶汽车的感知失败》,IEEE Robotics and Automation Letters,3,4,3860-3867(2018)
[29] Richards,S.M.、Berkenkamp,F.和Krause,A.(2018)。Lyapunov神经网络:动态系统安全学习的自适应稳定性认证。在CoRL中。
[30] Shalev Shwartz,S.、Shamir,O.和Shammah,S.(2017)。基于梯度的深度学习的失败。第34届机器学习国际会议记录(第70卷)(第3067-3075页)。
[31] Soga,T.和Otsuka,N.(2010年)。多面体不确定连续切换线性系统的输出反馈二次镇定。2010年美国控制会议记录(第3920-3925页)。
[32] 特隆,S。;伯加德,W。;Fox,D.,《概率机器人学》(2005),麻省理工学院出版社:麻萨诸塞州剑桥·Zbl 1081.68703号
[33] 托里埃洛,A。;Vielma,J.P.,拟合分段线性连续函数,《欧洲运筹学杂志》,219,1,86-95(2012)·Zbl 1244.90166号
[34] 袁,X。;何,P。;朱,Q。;Li,X.,《对抗性示例:深度学习的攻击和防御》,IEEE神经网络和学习系统汇刊,30,9,2805-2824(2019)
[35] 翟,G。;Lin,H。;Antsaklis,P.J.,具有多面体不确定性的切换线性系统的二次稳定性,国际控制杂志,76,7,747-753(2003)·Zbl 1034.93055号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。