{“状态”：“确定”，“消息类型”：“工作”，“信息版本”：“1.0.0”，“邮件”：{“索引”：{-“日期-部件”：[[2024,6,27]]，“日期-时间”：“2024-06-27T00:52:55Z”，“时间戳”：1719449575138}，“引用-计数”：19，“发布者”：“Elsevier BV”，“问题”：“5”，“许可证”：[{“开始”：{-date-parts“：[2021,1]]，”日期-时间“：“2021-01-01T00:00:00Z”，“时间戳”：1609459200000}，“content-version”：“tdm”，“delay-in-days”：0，“URL”：“https:\/\/www.elsevier.com//tdm\/userlicense\/1.0\/”}]，“content-domain”：{“domain”:[]，“crossmark-restriction”：false}，“short-container-title”：[“IFAC-PapersOnLine”]，“published-print”:{“date-parts”：[[2021]]}，”DOI“10.1016\/j.ifacol.2021.08.468”，“type”：“journal-article”，“created”：{“date-parts”：[[2021,9,9]]，“日期-时间”：“2021-09-09T22:30:26Z”，“时间戳”：1631226626000}，“页面”：“19-24”，“源”：“交叉引用”，“is-referenced-by-count”：9，“标题”：[“将基于模型的设计和无模型的策略优化结合起来学习安全、稳定的控制器”]，“前缀”：“10.1016”，“卷”：“54”，“作者”：[{“给定”：“泰勒”，“家族”：“韦斯坦布鲁克”，“序列”：“first”，“affiliation”：[]}，{“given”：“Ayush”，“family”：“Agrawal”，“sequence”：“additional”，“abfiliation“：[]{”given“：”Fernando“，”family“：”Casta\u00f1eda“，”sequence“：”additional：“Sreenath”，“sequence”：“additional”，“affiliation”：[]}]，“member”：“78”，“reference”：[{“key”：“10.1016\/j.ifacol.2021.08.468_bib0001”，“doi-asserted-by”：“crossref”，“unstructured”：“Akametalu，A.K.，Fisac，j.F.，Gillula，j.H.，Kaynama，S.，Zeilinger，M.N.，and Tomlin，C.j.（2014）。基于可达性的高斯过程安全学习。IEEE决策与控制会议，1424\u20131431。”，“doi”：“10.1109\/CDC.2014.7039601”}，{“issue”：“8”，“key”：“10.1016\/j.ifacol.2021.08.468_bib0002”，“doi-asserted-by”：“crossref”，“first page”：”3861“，“doi”：“101109\/TAC.2016.2638961”，“article-title”：“安全关键系统基于控制屏障函数的二次规划”，“volume”：：“62”，“author”：“Ames”，“year”：“2017”，“journal-title”：“IEEE Transactions on Automatic Control”}，{“issue”：“4”，“key”：“10.1016\/j.ifacol.2021.08.468_bib0003”，“doi-asserted-by”：“crossref”，“first-page”：“876”，“doi”：“101109\/TAC.2014.2299335”，“article-title”：“快速指数稳定控制lyapunov函数和混合零动力学”，“volume”：”59“，”author“：”Ames“，”year“：”2014“，”journal-title“：“IEEE Transactions on Automatic Control”}，{“key”：“10.1016\/j.ifacol.2021.08.468_bib0004”，“unstructured”：“Berkenkamp，F.，Turchetta，M.，Schoellig，A.，and Krause，A.（2017）。基于安全模型的强化学习，具有稳定性保证。在Neur IPS，908\u2013918。”}中，{，“非结构化”：“Choi，J.，Casta\u00f1eda，F.，Tomlin，C.，and Sreenath，K.（2020）。模型不确定性下安全关键控制的强化学习，使用控制Lyapunov函数和控制屏障函数。机器人学：科学与系统。Corvalis，OR。”，“DOI”：“10.15607\/RSS.2020.XVI.088”}，{“问题”：“8”，“关键”：“10.1016\/j.ifacol.2021.08.468_bib0006”，“doi-asserted-by”：“crossref”，“first page”：“1955”，“doi”：“10.106\/j.automatica.2014.04.021”，“article-title”：“三维两足机器人行走的模型、反馈控制和开放问题”，“volume”：”50“author”：“Grizzle”，“year”：“2014”，“journal-title“：”automatica“}”，{“key”:“10.1016”//j.ifacol.2021.01 8.468_bib0007“，“非结构化”：“Haarnoja，T.，Zhou，A.，Abbeel，P.，and Levine，S.（2018）。软参与者评论：非政策最大熵深度强化学习与随机参与者。CoRR，abs\/1801.01290.”}，{“issue”：“4”，“key”：“10.1016\/j.ifacol.2021.08.468_bib0008”，“doi-asserted-by”：“crossref”，“first-page”：“2096”，“doi”：“101109\/LRA.2017.2720851”，“article-title”：“通过强化学习控制四轮摩托车”，“volume”：“2”，“author”：“Hwangbo”，“year”：“2017”，“journal-title“：“Robotics and Auto.Letters”}，{“issue”：“1”，“key”：《10.1016\/j.ifacol.2021.08.468_bib0009》，“首页”：“1334”：“2016年”，“journal-title”：“机器学习研究杂志”}，{“key”：“10.1016\/j.ifacol.2021.08.468_bib00010”，“unstructured”：“Nguyen，Q.和Sreenath，K.（2015）。具有精确足迹位置的动态双足步行安全关键控制。在佐治亚州亚特兰大IFAC混合系统分析与设计中。”}：“10.1016\/j.ifacol.2021.08.468_bib00011”，“doi断言者”：“crossref”，“非结构化”：“Nguyen，Q.和Sreenath，K.（2016）。指数控制屏障函数，用于执行高相对度安全关键约束。在美国控制会议上，322\u2013328.”，“doi”：“10.1109\/ACC.2016.7524935”}，｛“key”：“10.1016\/j.ifacol.2021.08.468_bib00012”，“doi断言者”：“crossref”，“doi”：“10.1109\/TAC.20213059156”，“文章标题”：“动态机器人的鲁棒安全关键控制”，“作者”：“Nguyen”，“年份”：“2021”，“期刊标题”：“IEEE自动控制汇刊”}，{“问题”：“6”，“密钥”：“10.1016\/j.ifacol.2021.08.468_bib00013”，“doi断言者”：“crossref”，“first page”：“837”，“DOI”：“10.1109\/72.165588”，“article-title”：“直接自适应控制的高斯网络”，“volume”：”3“，“author”：“Sanner”，“year”：“1992”，“journal-title“：”IEEE Transactions on Neural networks“}，{”key“：”10.1016\/j.ifacol.2021.08.468_bib00014“，”series-title“：“自适应控制：稳定性、收敛性和鲁棒性”，“author”：“Sastry”，“year”：“1989”}，{“issue”：“2”，“key”：“10.1016\/j.ifacol.2021.08.468_bib00015”，“doi-asserted-by”：“crossref”，“first page”：《117》，“doi”：“101016\/0167-6911（89）90028-5”，“article-title”：“A\u2018universal\u2019关于非线性稳定的art-stein\u2019s定理的构造”，“volume”：“，”年份“：”1989“，“journal-title”：“Systems and Control Letters”}，{“key”：“10.1016\/j.ifacol.2021.08.468_bib00016”，“doi-asserted-by”：“crossref”，“unstructured”：“Taylor，A.，Singletary，A.，Yue，and Ames，A.（2020）。学习具有控制屏障功能的安全关键控制。L4DC，708\u2013717。”，“doi”：“10.23919\/ACC45564.2020.9147463”}、{“key”：“10.1016\/j.ifacol.2021.08.468_bib00017”，“doi-asserted-by”：“crossref”，“unstructured”：“Westenbroek，T.，Agrawal，A.，Casta\u00f1eda，F.，Sastry，S.S.，and Sreenath，K.（2021）。结合基于模型的设计和无模型的策略优化，学习安全稳定控制器。ar Xiv预印本。”，“doi”：“10.116\/j.ifacol.2031.08.468”}，{“key”：“10.1016\/j.ifacol.2021.08.468_bib00018”，“doi-asserted-by”：“crossref”，“unstructured”：“Westenbroek，T.，Casta\u00f1eda，F.，Agrawal，A.，Sastry，S.S.，and Sreenath，K.（2020）。学习未知动力学系统的最小形式稳定控制律。IEEE决策与控制会议，737\u2013744。”，“doi”：“10.1109\/CDC42340.2020.9304118”}，{“issue”：“27”，“key”：“10.1016\/j.ifacol.2021.08.468_bib00019”，“doi-asserted-by”：“crossref”，“first page”：”54“，“doi”：“101016\/j.ifacol.2015.1152”，“article-title”：“安全关键控制的控制屏障功能的鲁棒性”，“volume”：IFAC-PapersOnLine“}]，“容器标题”：[“IFAC PapersOnLine”]，“原始标题”：[]，“语言”：“en”，“链接”：[｛”URL“：”https:\/\/api.elsevier.com\/content\/article\/PII:S240589632101243X？httpAccept=text\/xml“，”内容类型“：”text\/xml“，”内容版本“：”vor“，”预期应用程序“：”文本挖掘“｝，｛”URL“：”https:\/\/api.elsevier.com\/content\/article\/PII:S24058994X 632101243X？httpAccept=text\/plain“，”content-type“：”text\/prain“，“content-version”：“vor”，“intended-application”：“text-mining”}]，“deposed”：{“date-parts”：[[2021,12,8]]，“date-time”：“2021-12-08T08:18:44Z”，“timestamp”：1638951524000}，“score”：1，“resource”：{“primary”：“URL”：“https:\\/linkinghub.elsevier.com/retrieve\/pii\/S2405899 632101243X“}}，”副标题“：[]，”shorttitle“：[]，”issued“：{”date-parts“：[[2021]]}，”references-count“：19，”journal-issue“：{“issue”：“5”，”published-print“：{”date-ports“：[2021]]}}，“alternative-id”：[“S240589632101243X”]，“URL”：“http://\/dx.doi.org\/101016\/j.ifacol.2021.08.468”，“relation”：{}、“ISSN”：[”2405-8963“]，“ISSN-type”：[{“value”：“2405-8965”，“type”:“print”}]，“subject”：[]，“发布了“：{“date-parts”：[[2021]]}}}