{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部件”:[[2024,6,27]],“日期-时间”:“2024-06-27T00:52:55Z”,“时间戳”:1719449575138},“引用-计数”:19,“发布者”:“Elsevier BV”,“问题”:“5”,“许可证”:[{“开始”:{-date-parts“:[2021,1]],”日期-时间“:“2021-01-01T00:00:00Z”,“时间戳”:1609459200000},“content-version”:“tdm”,“delay-in-days”:0,“URL”:“https:\/\/www.elsevier.com//tdm\/userlicense\/1.0\/”}],“content-domain”:{“domain”:[],“crossmark-restriction”:false},“short-container-title”:[“IFAC-PapersOnLine”],“published-print”:{“date-parts”:[[2021]]},”DOI“10.1016\/j.ifacol.2021.08.468”,“type”:“journal-article”,“created”:{“date-parts”:[[2021,9,9]],“日期-时间”:“2021-09-09T22:30:26Z”,“时间戳”:1631226626000},“页面”:“19-24”,“源”:“交叉引用”,“is-referenced-by-count”:9,“标题”:[“将基于模型的设计和无模型的策略优化结合起来学习安全、稳定的控制器”],“前缀”:“10.1016”,“卷”:“54”,“作者”:[{“给定”:“泰勒”,“家族”:“韦斯坦布鲁克”,“序列”:“first”,“affiliation”:[]},{“given”:“Ayush”,“family”:“Agrawal”,“sequence”:“additional”,“abfiliation“:[]{”given“:”Fernando“,”family“:”Casta\u00f1eda“,”sequence“:”additional:“Sreenath”,“sequence”:“additional”,“affiliation”:[]}],“member”:“78”,“reference”:[{“key”:“10.1016\/j.ifacol.2021.08.468_bib0001”,“doi-asserted-by”:“crossref”,“unstructured”:“Akametalu,A.K.,Fisac,j.F.,Gillula,j.H.,Kaynama,S.,Zeilinger,M.N.,and Tomlin,C.j.(2014)。基于可达性的高斯过程安全学习。IEEE决策与控制会议,1424\u20131431。”,“doi”:“10.1109\/CDC.2014.7039601”},{“issue”:“8”,“key”:“10.1016\/j.ifacol.2021.08.468_bib0002”,“doi-asserted-by”:“crossref”,“first page”:”3861“,“doi”:“101109\/TAC.2016.2638961”,“article-title”:“安全关键系统基于控制屏障函数的二次规划”,“volume”::“62”,“author”:“Ames”,“year”:“2017”,“journal-title”:“IEEE Transactions on Automatic Control”},{“issue”:“4”,“key”:“10.1016\/j.ifacol.2021.08.468_bib0003”,“doi-asserted-by”:“crossref”,“first-page”:“876”,“doi”:“101109\/TAC.2014.2299335”,“article-title”:“快速指数稳定控制lyapunov函数和混合零动力学”,“volume”:”59“,”author“:”Ames“,”year“:”2014“,”journal-title“:“IEEE Transactions on Automatic Control”},{“key”:“10.1016\/j.ifacol.2021.08.468_bib0004”,“unstructured”:“Berkenkamp,F.,Turchetta,M.,Schoellig,A.,and Krause,A.(2017)。基于安全模型的强化学习,具有稳定性保证。在Neur IPS,908\u2013918。”}中,{,“非结构化”:“Choi,J.,Casta\u00f1eda,F.,Tomlin,C.,and Sreenath,K.(2020)。模型不确定性下安全关键控制的强化学习,使用控制Lyapunov函数和控制屏障函数。机器人学:科学与系统。Corvalis,OR。”,“DOI”:“10.15607\/RSS.2020.XVI.088”},{“问题”:“8”,“关键”:“10.1016\/j.ifacol.2021.08.468_bib0006”,“doi-asserted-by”:“crossref”,“first page”:“1955”,“doi”:“10.106\/j.automatica.2014.04.021”,“article-title”:“三维两足机器人行走的模型、反馈控制和开放问题”,“volume”:”50“author”:“Grizzle”,“year”:“2014”,“journal-title“:”automatica“}”,{“key”:“10.1016”//j.ifacol.2021.01 8.468_bib0007“,“非结构化”:“Haarnoja,T.,Zhou,A.,Abbeel,P.,and Levine,S.(2018)。软参与者评论:非政策最大熵深度强化学习与随机参与者。CoRR,abs\/1801.01290.”},{“issue”:“4”,“key”:“10.1016\/j.ifacol.2021.08.468_bib0008”,“doi-asserted-by”:“crossref”,“first-page”:“2096”,“doi”:“101109\/LRA.2017.2720851”,“article-title”:“通过强化学习控制四轮摩托车”,“volume”:“2”,“author”:“Hwangbo”,“year”:“2017”,“journal-title“:“Robotics and Auto.Letters”},{“issue”:“1”,“key”:《10.1016\/j.ifacol.2021.08.468_bib0009》,“首页”:“1334”:“2016年”,“journal-title”:“机器学习研究杂志”},{“key”:“10.1016\/j.ifacol.2021.08.468_bib00010”,“unstructured”:“Nguyen,Q.和Sreenath,K.(2015)。具有精确足迹位置的动态双足步行安全关键控制。在佐治亚州亚特兰大IFAC混合系统分析与设计中。”}:“10.1016\/j.ifacol.2021.08.468_bib00011”,“doi断言者”:“crossref”,“非结构化”:“Nguyen,Q.和Sreenath,K.(2016)。指数控制屏障函数,用于执行高相对度安全关键约束。在美国控制会议上,322\u2013328.”,“doi”:“10.1109\/ACC.2016.7524935”},{“key”:“10.1016\/j.ifacol.2021.08.468_bib00012”,“doi断言者”:“crossref”,“doi”:“10.1109\/TAC.20213059156”,“文章标题”:“动态机器人的鲁棒安全关键控制”,“作者”:“Nguyen”,“年份”:“2021”,“期刊标题”:“IEEE自动控制汇刊”},{“问题”:“6”,“密钥”:“10.1016\/j.ifacol.2021.08.468_bib00013”,“doi断言者”:“crossref”,“first page”:“837”,“DOI”:“10.1109\/72.165588”,“article-title”:“直接自适应控制的高斯网络”,“volume”:”3“,“author”:“Sanner”,“year”:“1992”,“journal-title“:”IEEE Transactions on Neural networks“},{”key“:”10.1016\/j.ifacol.2021.08.468_bib00014“,”series-title“:“自适应控制:稳定性、收敛性和鲁棒性”,“author”:“Sastry”,“year”:“1989”},{“issue”:“2”,“key”:“10.1016\/j.ifacol.2021.08.468_bib00015”,“doi-asserted-by”:“crossref”,“first page”:《117》,“doi”:“101016\/0167-6911(89)90028-5”,“article-title”:“A\u2018universal\u2019关于非线性稳定的art-stein\u2019s定理的构造”,“volume”:“,”年份“:”1989“,“journal-title”:“Systems and Control Letters”},{“key”:“10.1016\/j.ifacol.2021.08.468_bib00016”,“doi-asserted-by”:“crossref”,“unstructured”:“Taylor,A.,Singletary,A.,Yue,and Ames,A.(2020)。学习具有控制屏障功能的安全关键控制。L4DC,708\u2013717。”,“doi”:“10.23919\/ACC45564.2020.9147463”}、{“key”:“10.1016\/j.ifacol.2021.08.468_bib00017”,“doi-asserted-by”:“crossref”,“unstructured”:“Westenbroek,T.,Agrawal,A.,Casta\u00f1eda,F.,Sastry,S.S.,and Sreenath,K.(2021)。结合基于模型的设计和无模型的策略优化,学习安全稳定控制器。ar Xiv预印本。”,“doi”:“10.116\/j.ifacol.2031.08.468”},{“key”:“10.1016\/j.ifacol.2021.08.468_bib00018”,“doi-asserted-by”:“crossref”,“unstructured”:“Westenbroek,T.,Casta\u00f1eda,F.,Agrawal,A.,Sastry,S.S.,and Sreenath,K.(2020)。学习未知动力学系统的最小形式稳定控制律。IEEE决策与控制会议,737\u2013744。”,“doi”:“10.1109\/CDC42340.2020.9304118”},{“issue”:“27”,“key”:“10.1016\/j.ifacol.2021.08.468_bib00019”,“doi-asserted-by”:“crossref”,“first page”:”54“,“doi”:“101016\/j.ifacol.2015.1152”,“article-title”:“安全关键控制的控制屏障功能的鲁棒性”,“volume”:IFAC-PapersOnLine“}],“容器标题”:[“IFAC PapersOnLine”],“原始标题”:[],“语言”:“en”,“链接”:[{”URL“:”https:\/\/api.elsevier.com\/content\/article\/PII:S240589632101243X?httpAccept=text\/xml“,”内容类型“:”text\/xml“,”内容版本“:”vor“,”预期应用程序“:”文本挖掘“},{”URL“:”https:\/\/api.elsevier.com\/content\/article\/PII:S24058994X 632101243X?httpAccept=text\/plain“,”content-type“:”text\/prain“,“content-version”:“vor”,“intended-application”:“text-mining”}],“deposed”:{“date-parts”:[[2021,12,8]],“date-time”:“2021-12-08T08:18:44Z”,“timestamp”:1638951524000},“score”:1,“resource”:{“primary”:“URL”:“https:\\/linkinghub.elsevier.com/retrieve\/pii\/S2405899 632101243X“}},”副标题“:[],”shorttitle“:[],”issued“:{”date-parts“:[[2021]]},”references-count“:19,”journal-issue“:{“issue”:“5”,”published-print“:{”date-ports“:[2021]]}},“alternative-id”:[“S240589632101243X”],“URL”:“http://\/dx.doi.org\/101016\/j.ifacol.2021.08.468”,“relation”:{}、“ISSN”:[”2405-8963“],“ISSN-type”:[{“value”:“2405-8965”,“type”:“print”}],“subject”:[],“发布了“:{“date-parts”:[[2021]]}}}