崔晓红;陈嘉玉;崔,杨;徐素安 基于非策略积分强化学习的两人非线性Stackelberg微分对策。 (英语) Zbl 07852134号 J.富兰克林研究所。 361,第8号,文章ID 106812,第18页(2024)。MSC公司:91A05型 91A23型 91A65型 49号70 93天20分 PDF格式BibTeX公司 XML格式引用 \textit{X.Cui}等人,J.Franklin Inst.361,No.8,文章ID 106812,18 p.(2024;Zbl 07852134) 全文: 内政部
马,肖;元,元 基于非策略无模型强化学习的线性离散时间系统鲁棒分层对策。 (英语) Zbl 07852036号 J.富兰克林研究所。 361,第7号,文章ID 106711,17页(2024)。MSC公司:91A65型 93C55美元 93二氧化碳 PDF格式BibTeX公司 XML格式引用 \textit{X.Ma}和\textit{Y.Yuan},J.Franklin Inst.361,No.7,文章ID 106711,17 p.(2024;Zbl 07852036) 全文: 内政部
高,袁;刘建国;李武晨 具有非线性激活的有限状态平均场对策的主方程。 (英语) Zbl 07841474号 离散连续。动态。系统。,序列号。B类 29,第7期,2837-2879(2024)。MSC公司:49号80 49升12 35层21 60J20型 34K35型 PDF格式BibTeX公司 XML格式引用 \textit{Y.Gao}等人,离散Contin。动态。系统。,序列号。B 29,编号7,2837--2879(2024;Zbl 07841474) 全文: 内政部 arXiv公司
亚瑟·多尔戈波洛夫 囚犯困境中的强化学习。 (英语) Zbl 07839933号 游戏经济。行为。 144, 84-103 (2024)。MSC公司:91A22型 91A05型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{A.Dolgopolov},游戏经济。行为。144,84-103(2024;Zbl 07839933) 全文: 内政部
刘璐萍;贾文胜 具有有限状态和动作空间的平均场对策的适定性。 (英语) Zbl 07839676号 J.优化。理论应用。 201,编号1,36-53(2024)。MSC公司:49公里40 49号80 第91页第13页 91A25型 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{L.-p.Liu}和\textit{W.-s.Jia},J.Optim。理论应用。201,编号1,36-53(2024;Zbl 07839676) 全文: 内政部 OA许可证
马里奥·列斐伏尔 两个吸收屏障之间的受控二维马尔可夫链。 (英语) Zbl 07834226号 J.差异Equ。申请。 30,编号3,278-286(2024)。MSC公司:93E20型 93C55美元 49升20 60J20型 PDF格式BibTeX公司 XML格式引用 \textit{M.Lefebvre},J.Difference等于。申请。30,编号3,278--286(2024;Zbl 07834226) 全文: 内政部
奥尔加·克里沃罗特科;谢尔盖·卡巴尼金 新冠肺炎传播建模的人工智能。 (英语) Zbl 07829446号 J.逆病态概率。 32,第2号,297-332(2024)。MSC公司:92天30分 34A55型 65立方米 68T07型 91A16型 49升12 PDF格式BibTeX公司 XML格式引用 \textit{O.Krivorotko}和\textit{S.Kabanikhin},J.逆病态探针。32,第2号,297--332(2024;Zbl 07829446) 全文: 内政部
赵平;李学荣;王寿阳 从决策角度理解人机交互:基于围棋游戏的实证研究。 (英语) Zbl 07827321号 J.系统。科学。复杂。 37,第2期,647-667(2024)。MSC公司:91B06型 91A35型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{P.Zhao}等人,J.Syst。科学。复杂。37,编号2,647--667(2024;Zbl 07827321) 全文: 内政部
韩秀梅;赵旭东;王、丁;王伯辉 基于事件触发的在线积分强化学习用于未知约束非线性系统的最优控制。 (英语) Zbl 07827183号 国际J.控制 97,第2期,213-225(2024)。MSC公司:93元65角 93立方厘米 49升12 PDF格式BibTeX公司 XML格式引用 \textit{X.Han}等人,国际期刊控制97,No.2,213--225(2024;Zbl 07827183) 全文: 内政部
郑文倩;杨雄 基于强化学习的饱和非线性系统鲁棒动态事件触发控制。 (英语) Zbl 07821257号 国际J鲁棒非线性控制 34,编号4,2659-2674(2024)。MSC公司:93B35型 93元65角 49升12 93立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{W.Zheng}和\textit{X.Yang},国际鲁棒非线性控制34,No.4,2659--2674(2024;Zbl 07821257) 全文: 内政部
吕永丰;赵军;李蓉;任雪梅 基于自适应积分强化学习Q函数的具有未知扰动的多输入系统鲁棒最优控制。 (英语) Zbl 07821188号 国际J鲁棒非线性控制 34,第6号,4234-4251(2024)。MSC公司:93C40型 93B35型 49升12 91A10号 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{Y.Lv}等,国际鲁棒非线性控制34,No.6,4234-4251(2024;Zbl 07821188) 全文: 内政部
兰、雪晶;严佳培;何树德;赵志佳;邹涛 具有碰撞避免的多智能体系统的分布式协同强化学习。 (英语) Zbl 07821102号 国际J鲁棒非线性控制 34,第1号,567-585(2024)。MSC公司:93甲16 49升20 PDF格式BibTeX公司 XML格式引用 \textit{X.Lan}等人,《国际鲁棒非线性控制》34,No.1,567--585(2024;Zbl 07821102) 全文: 内政部
郭欣;奥斯曼·蒙吉德 GAN训练:游戏和随机控制方法。 (英语) Zbl 07818735号 数学。财务 34,第2期,522-556(2024年)。MSC公司:91G80型 68T05型 91A15型 93E20型 PDF格式BibTeX公司 XML格式引用 \textit{X.Guo}和\textit{O.Mounjid},数学。财务34,No.2,522--556(2024;Zbl 07818735) 全文: 内政部 arXiv公司
拉玛(Rama);熊、伟 经销商市场中做市算法的动态:学习和默契共谋。 (英语) Zbl 07818734号 数学。财务 34,第2期,467-521(2024)。MSC公司:91G15型 91A15型 91A80型 91年第35季度 PDF格式BibTeX公司 XML格式引用 \textit{R.Cont}和\textit{W.Xiong},数学。财务34,No.2,467--521(2024;Zbl 07818734) 全文: 内政部 OA许可证
埃特萨米,S.拉苏尔 学习具有独立链的(n)人随机博弈的平稳纳什均衡策略。 (英语) Zbl 07814424号 SIAM J.控制优化。 62,第2期,799-825(2024)。MSC公司:91A15型 91A11号机组 91A68型 PDF格式BibTeX公司 XML格式引用 \textit{S.R.Etesami},SIAM J.控制优化。62,第2号,799--825(2024;Zbl 07814424) 全文: 内政部 arXiv公司
Mertikopoulos,Panayotis公司;谢亚萍;沃尔坎·塞弗尔 游戏中学习的统一随机近似框架。 (英语) Zbl 07807883号 数学。程序。 203,编号1-2(B),559-609(2024)。MSC公司:91A26型 91A68型 91A15型 PDF格式BibTeX公司 XML格式引用 \textit{P.Mertikopoulos}等人,《数学》。程序。203,编号1--2(B),559--609(2024;Zbl 07807883) 全文: 内政部 arXiv公司 哈尔 OA许可证
何康辉;石胜凌;van den Boom,吨;巴特·德·舒特 约束线性系统的近似动态规划:分段二次近似方法。 (英语) Zbl 07803912号 Automatica公司 160,文章ID 111456,9 p.(2024)。MSC公司:93B45码 49升20 49甲10 PDF格式BibTeX公司 XML格式引用 \textit{K.He}等人,Automatica 160,文章ID 111456,9 p.(2024;Zbl 07803912) 全文: 内政部 arXiv公司 OA许可证
唐、清;宋家豪 潜在平均场博弈中的最优策略学习:平滑策略迭代算法。 (英语) Zbl 1532.91014号 SIAM J.控制优化。 62,第1号,351-375(2024)。MSC公司:91A16型 91A26型 2006年6月65日 PDF格式BibTeX公司 XML格式引用 \textit{Q.Tang}和\textit{J.Song},SIAM J.Control Optim。62,编号1,351--375(2024;Zbl 1532.91014) 全文: 内政部 arXiv公司
贝丽妮斯·安妮·诺依曼 具有有限状态和动作空间的平均场对策的近视调整过程。 (英语) Zbl 1531.91029号 国际博弈论 53,第1期,159-195(2024)。MSC公司:91A16型 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{B.A.Neumann},《国际博弈论》53,第1期,159--195(2024年;Zbl 1531.91029) 全文: 内政部 arXiv公司 OA许可证
弗莱德里克·法利诺夫斯基;Mertikopoulos,Panayotis公司 关于复制因子动力学的离散时间起源:从收敛到不稳定和混沌。 arXiv:2402.09824 预印本,arXiv:2402.09824[math.DS](2024)。MSC公司:91A22型 91A26型 第37页 37号40 91A14号机组 BibTeX公司 引用 \textit{F.Falniowski}和\textit{P.Mertikopoulos},“复制子动力学的离散时间起源:从收敛到不稳定和混沌”,预印本,arXiv:2402.09824[math.DS](2024) 全文: arXiv公司 OA许可证
奥利维尔·博卡诺夫斯基;泽维尔·沃林 微分对策的神经网络。 arXiv:2402.02792 预印本,arXiv:2402.02792[math.OC](2024)。MSC公司:35层21 49升20 68T07型 BibTeX公司 引用 \textit{O.Bokanowski}和\textit{X.Warin},“微分博弈的神经网络”,预印本,arXiv:2402.02792[math.OC](2024) 全文: arXiv公司 OA许可证
埃兰·什马亚;布鲁诺·齐利奥托 平均场博弈中的贝叶斯学习。 arXiv公司:2401.17696 预印本,arXiv:2401.17696[math.OC](2024)。MSC公司:91A16型 91A27型 91A26型 BibTeX公司 引用 \textit{E.Shmaya}和\textit{B.Ziliotto},“平均场游戏中的贝叶斯学习”,预印本,arXiv:2401.17696[math.OC](2024) 全文: arXiv公司 OA许可证
黄宗生;白、薇薇;李铁山;龙,岳;陈,C.L.菲利普;梁红晶;杨汉清 具有规定性能的严格反馈非线性系统的自适应强化学习最优跟踪控制。 (英语) Zbl 07834481号 信息科学。 621, 407-423 (2023)。MSC公司:93C40型 49升20 93B52号 93立方厘米 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{Z.Huang}等人,《信息科学》。621407--423(2023;Zbl 07834481) 全文: 内政部
邱、灿;朱亚辉;张康浩;于登秀;菲利普·陈,C.L。 持续行动与数据驱动的补偿网络和有限的学习能力重复了困境。 (英语) Zbl 07829676号 信息科学。 632, 516-528 (2023)。MSC公司:91A22型 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{C.邱}等人,《信息科学》。632516-528(2023年;兹bl 07829676) 全文: 内政部
谭,少林;陶,叶;冉茂鹏;刘浩 单调博弈中具有异质学习率的分布投影梯度博弈的收敛性。 (英语) Zbl 07827712号 系统。控制信函。 182,文章ID 105654,8 p.(2023)。MSC公司:91A26型 PDF格式BibTeX公司 XML格式引用 \textit{S.Tan}等人,系统。控制信函。182,文章ID 105654,8 p.(2023;Zbl 07827712) 全文: 内政部
张殿峰;姚莹;吴兆景 基于消失粘性法的输入约束多智能体系统的强化学习最优同步控制。 (英语) Zbl 07826353号 信息科学。 637,文章ID 118949,19 p.(2023)。MSC公司:93D99型 93甲16 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{D.Zhang}等人,《信息科学》。637,文章ID 118949,19 p.(2023;Zbl 07826353) 全文: 内政部
阿索曼·奥兹达格勒;穆罕默德·沙因。;张凯庆 随机博弈中的独立学习。 (英语) Zbl 07822596号 Beliaev,Dmitry(编辑)等人,《2022年国际数学家大会》,ICM 2022,芬兰赫尔辛基,虚拟,2022年7月6日至14日。第7卷。第15-20节。柏林:欧洲数学学会(EMS)。5340-5373 (2023).MSC公司:91A15型 91A26型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{A.Ozdaglar}等人,in:2022年国际数学家大会,ICM 2022,芬兰赫尔辛基,虚拟,2022年7月6日至14日。第7卷。第15-20节。柏林:欧洲数学学会(EMS)。5340——5373(2023年;Zbl 07822596) 全文: 内政部 arXiv公司 OA许可证
崔晓红;彭彬彬;王斌瑞;王丽娜 未知连续非线性系统非零和跟踪博弈的事件触发神经经验重放学习。 (英语) Zbl 07816399号 国际J鲁棒非线性控制 33,编号12,6553-6575(2023)。MSC公司:93元65角 93C40型 90立方厘米 93立方厘米 91A05型 PDF格式BibTeX公司 XML格式引用 \textit{X.Cui}等,国际鲁棒非线性控制33,No.12,6553--6575(2023;Zbl 07816399) 全文: 内政部
伯努瓦·杜沃克尔;Mertikopoulos,Panayotis公司;马蒂亚斯·斯塔迪格尔;弗默伦,德里斯 时变博弈中的多智能体在线学习。 (英语) Zbl 07808972号 数学。操作。研究。 48,编号2,914-941(2023)。MSC公司:91A26型 91A20型 PDF格式BibTeX公司 XML格式引用 \textit{B.Duvocelle}等人,《数学》。操作。第48号决议,第2号,914--941(2023年;Zbl 07808972) 全文: 内政部 arXiv公司
郭欣;胡安然;徐仁元;张俊姿 一个学习平均场游戏的一般框架。 (英语) Zbl 07808962号 数学。操作。研究。 48,第2期,656-686(2023)。MSC公司:91A16型 68T05型 91A15型 91B26型 PDF格式BibTeX公司 XML格式引用 \textit{X.Guo}等人,数学。操作。第48号决议,第2号,656--686(2023年;Zbl 07808962) 全文: 内政部 arXiv公司
谢巧敏;陈玉东;王兆然;杨卓然 利用函数逼近和相关均衡学习零和同时移动马尔可夫对策。 (英语) Zbl 07808945号 数学。操作。研究。 48,编号1,433-462(2023)。MSC公司:68T05型 91A15型 91A25型 PDF格式BibTeX公司 XML格式引用 \textit{Q.Xie}等人,数学。操作。第48号决议,第1号,433--462(2023年;Zbl 07808945) 全文: 内政部 arXiv公司
温伯格,K。;斯泰尼尔,L。;康蒂,S。;M.奥尔蒂斯。 计算力学中的数据驱动游戏。 (英语) Zbl 07804963号 计算。方法应用。机械。工程师。 417,A部分,文章ID 116399,第27页(2023)。MSC公司:74S05号 74S99型 91A10号 PDF格式BibTeX公司 XML格式引用 \textit{K.Weinberg}等人,计算。方法应用。机械。工程417,A部分,文章ID 116399,27 p.(2023;Zbl 07804963) 全文: 内政部 arXiv公司
陈林;董超;他,舒德;戴世禄 基于actor-critic学习结构的无人机自适应最优编队控制。 (英语) Zbl 1532.93155号 国际J鲁棒非线性控制 33,编号8,4504-4522(2023)。MSC公司:93C40型 93C85号 93甲16 49N90型 PDF格式BibTeX公司 XML格式引用 \textit{L.Chen}等,国际鲁棒非线性控制33,No.8,4504--4522(2023;Zbl 1532.93155) 全文: 内政部
赵明明;王、丁;乔俊飞;胡凌志 一类非线性非仿射系统的广义N步值梯度学习最优轨迹跟踪控制。 (英语) Zbl 1532.93204号 国际J鲁棒非线性控制 33,第6号,3471-3490(2023)。MSC公司:93C40型 93立方厘米 49升20 PDF格式BibTeX公司 XML格式引用 \textit{M.Zhao}等,《国际鲁棒非线性控制》33,No.6,3471--3490(2023;Zbl 1532.93204) 全文: 内政部
巴赫(Christian W。;杰雷米·卡贝萨 词汇学同意不同意和完美平衡。 (英语) 兹比尔07799770 数学杂志。经济。 109,文章ID 102908,17 p.(2023)。MSC公司:91A26型 PDF格式BibTeX公司 XML格式引用 \textit{C.W.巴赫}和textit{J.卡布萨},J.数学。经济。109,文章ID 102908,17 p.(2023;Zbl 07799770) 全文: 内政部 OA许可证
巴蒂加利,P。;Catonini,E。;J.马尼利。 连续博弈中的信念变化、理性和战略推理。 (英语) 兹伯利07786816 游戏经济。行为。 142, 527-551 (2023)。MSC公司:91A20型 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{P.Battigalli}等人,《游戏经济》。行为。142527--551(2023年;Zbl 07786816) 全文: 内政部
恩里克·卡萨雷斯。;瓜达卢佩岛玛丽亚·萨拉查 开放经济中的最佳经济政策和增长。 (英语) Zbl 1530.91375号 J.戴恩。游戏 10,第4号,287-303(2023)。MSC公司:91磅62 91B66型 91B64型 49N90型 PDF格式BibTeX公司 XML格式引用 \textit{E.R.Casares}和\textit{M.G.García-Salazar},J.Dyn。第10届奥运会,第4名,287--303(2023年;Zbl 1530.91375) 全文: 内政部
Bosen Lian;薛文倩;刘易斯,弗兰克·L。 异构多层次模仿学习。 (英语) Zbl 1530.91018号 控制理论技术。 21,第3号,281-291(2023)。MSC公司:91A06型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{B.Lian}等人,《控制理论技术》。21,第3号,281--291(2023;Zbl 1530.91018) 全文: 内政部
皮埃尔·拉维涅;洛朗·菲佛 潜在平均场对策中的广义条件梯度和学习。 (英语) Zbl 07771776号 申请。数学。最佳方案。 88,第3期,第89号论文,36页(2023年)。MSC公司:90摄氏52度 91A16型 91A26型 91B06型 49K20型 35层21 91年第35季度 PDF格式BibTeX公司 XML格式引用 \textit{P.Lavigne}和\textit{L.Pfeiffer},应用。数学。最佳方案。88,第3号,第89号论文,36页(2023;Zbl 07771776) 全文: 内政部 arXiv公司 哈尔
奥利维尔·博卡诺夫斯基;艾薇尔·普罗斯特;泽维尔·沃林 一阶HJB方程的神经网络及其在带有障碍项的波前传播中的应用。 (英语) Zbl 1527.35140号 序号部分差异。埃克。申请。 4,第5号,第45号论文,36页(2023年)。MSC公司:35层21 49升20 68T07型 PDF格式BibTeX公司 XML格式引用 \textit{O.Bokanowski}等人,SN部分差异。埃克。申请。4,第5号,第45号论文,36页(2023年;Zbl 1527.35140) 全文: 内政部 arXiv公司 哈尔
尼尔·卡马德拉;阿纳·布西奇;肖恩·梅恩(Sean P.Meyn)。 Kullback-Leibler二次最优控制。 (英语) Zbl 07764830号 SIAM J.控制优化。 61,第5期,3234-3258(2023)。MSC公司:90立方厘米 90立方厘米 60J20型 90C25型 PDF格式BibTeX公司 XML格式引用 \textit{N.Cammardella}等人,SIAM J.控制优化。61,编号5,3234-3258(2023;Zbl 07764830) 全文: 内政部 arXiv公司
朱利奥·克莱姆普纳。 马尔可夫博弈中用于计算近最优策略的贝叶斯强化学习方法。 (英语) Zbl 1527.91013号 安。数学。Artif公司。智力。 91,编号5,675-690(2023)。MSC公司:91A15型 91A27型 68T05型 60J20型 PDF格式BibTeX公司 XML格式引用 \textit{J.B.Clempner},Ann.数学。Artif公司。智力。91,编号5,675--690(2023;Zbl 1527.91013) 全文: 内政部
张琪;杨,杨;宋雪;谢晓然;朱乃波;刘志 基于自适应动态规划的动态未知双积分多智能体系统的最优一致性控制。 (英语) Zbl 1531.93395号 最佳方案。控制应用程序。方法 44,第5期,2883-2899(2023)。MSC公司:93D50型 93甲16 93C40型 49升20 PDF格式BibTeX公司 XML格式引用 \textit{Q.Zhang}等人,Optim。控制应用程序。方法44,No.5,2883--2899(2023;Zbl 1531.93395) 全文: 内政部
秦、燕;曹、梁;鲁,青;潘英南 基于强化学习的外部扰动下严格反馈非线性系统的优化反推控制。 (英语) 兹比尔1531.93132 最佳方案。控制应用程序。方法 44,第5期,2724-2743(2023)。MSC公司:93B52号 93立方厘米 93C73号 49N90型 PDF格式BibTeX公司 XML格式引用 \textit{Y.Qin}等人,Optim。控制应用程序。方法44,No.5,2724--2743(2023;Zbl 1531.93132) 全文: 内政部
卢,杨;李文章;张兴龙;Xu、Xin 连续时间后退地平线强化学习及其在自动地面车辆路径跟踪控制中的应用。 (英语) Zbl 1531.93312号 最佳方案。控制应用程序。方法 44,第3期,1129-1147(2023)。MSC公司:93C85号 93立方厘米 49升20 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{Y.Lu}等人,Optim。控制应用程序。方法44,No.3,1129--1147(2023;Zbl 1531.93312) 全文: 内政部
魏庆来;刘玉佳;陆景伟;凌,君;振华栾;陈明良 一种用于锅炉-涡轮机系统的最优跟踪控制的新的积分批评学习。 (英语) Zbl 1531.93217号 最佳方案。控制应用程序。方法 44,第2期,830-845(2023年)。MSC公司:93C40型 93立方厘米 49升20 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{Q.Wei}等人,Optim。控制应用程序。方法44,No.2,830--845(2023;Zbl 1531.93217) 全文: 内政部
杨雄;周英江;高忠科 具有非对称饱和执行器的非线性系统鲁棒镇定的强化学习。 (英语) Zbl 1525.93343号 神经网络。 158, 132-141 (2023)。MSC公司:93D21号 93立方厘米 93C40型 49升20 PDF格式BibTeX公司 XML格式引用 \textit{X.Yang}等人,神经网络。158132--141(2023年;Zbl 1525.93343) 全文: 内政部
蒋学英;黄敏;邝汉斌;史惠远;王兴伟;Lee、Loo Hay 通过非策略2D游戏(Q)学习改进了批处理过程的无模型(H)控制。 (英语) Zbl 1526.93042号 国际J.控制 96,第10号,2447-2463(2023)。MSC公司:93B36型 91A10号 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{X.Jiang}等人,国际期刊控制96,No.10,2447--2463(2023;Zbl 1526.93042) 全文: 内政部
卡尔·库尼什;多纳托·瓦拉斯 有限时域控制问题的最优多项式反馈律。 (英语) Zbl 07750285号 计算。数学。申请。 148, 113-125 (2023)。MSC公司:49升20 49号35 65克05 35层21 第49页第25页 PDF格式BibTeX公司 XML格式引用 \textit{K.Kunisch}和\textit{D.Vásquez-Varas},计算。数学。申请。148113-125(2023年;Zbl 07750285) 全文: 内政部 arXiv公司 OA许可证
Hoppe Wewetzer,Heidrun公司;乔治·卡塞诺斯;埃姆雷·奥兹德诺伦 公共与私人学习下竞争对科学进步的影响。 (英语) Zbl 1527.91036号 《经济学杂志》。理论 212,文章ID 105702,35 p.(2023)。MSC公司:91A55型 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{H.Hoppe-Weetzer}等人,《经济学杂志》。理论212,文章ID 105702,35 p.(2023;Zbl 1527.91036) 全文: 内政部 OA许可证
皮尔保罗·巴蒂加利;法布里西奥·帕内比安科;Pin,保罗 网络游戏中的学习与自我确认平衡。 (英语) Zbl 1527.91034号 《经济学杂志》。理论 212,文章ID 105700,42 p.(2023)。MSC公司:91A43型 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{P.Battigalli}等人,J.Econ。理论212,文章ID 105700,42 p.(2023;Zbl 1527.91034) 全文: 内政部 arXiv公司 OA许可证
贝尔亚夫斯基,G.I。;Danilova,N.V.公司。;乌戈林茨基,G.A。 协调投资管理利益的模式。 (英语) Zbl 1522.91207号 国际博弈论评论。 25,第1号,文章ID 2350002,12 p.(2023)。MSC公司:91G10型 91A05型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{G.I.Belyavsky}等人,《国际博弈论》第25版,第1期,文章编号2350002,12页(2023年;Zbl 1522.91207) 全文: 内政部
波维达,豪尔赫一世。;米罗斯拉夫·克里斯蒂奇;塔梅尔·巴沙尔 时变网络中的固定时间纳什均衡搜索。 (英语) Zbl 07742225号 IEEE传输。自动。控制 68,第4期,1954-1969(2023)。MSC公司:93至XX PDF格式BibTeX公司 XML格式引用 \textit{J.I.Poveda}等人,IEEE Trans。自动。控制68,编号4,1954--1969(2023;Zbl 07742225) 全文: 内政部
巴伊拉克塔尔,埃尔罕;陈涛 模型不确定性下的非参数自适应鲁棒控制。 (英语) 兹比尔1522.49016 SIAM J.控制优化。 61,编号5,2737-2760(2023)。MSC公司:49J55型 60J99型 60J10型 49升20 93E20型 93E35型 60G15年 65克05 90立方厘米 90立方厘米 91G10型 91G60型 62G05型 PDF格式BibTeX公司 XML格式引用 \textit{E.Bayraktar}和\textit{T.Chen},SIAM J.控制优化。61,编号5,2737--2760(2023;Zbl 1522.49016) 全文: 内政部 arXiv公司
严锐;张伟贤;邓瑞良;段晓明;石宗英;钟毅生 通过最佳和更好的响应在两层对称游戏中进行评估和学习。 (英语) Zbl 1521.91004号 信息科学。 647,文章ID 119459,16 p.(2023)。MSC公司:91A05型 91A15型 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{R.Yan}等人,《信息科学》。647,文章ID 119459,16 p.(2023;Zbl 1521.91004) 全文: 内政部 arXiv公司
张恒 一种基于自适应动态规划的无限小时线性二次随机最优控制算法。 (英语) Zbl 1521.93211号 J.应用。数学。计算。 69,编号3,2741-2760(2023)。MSC公司:93E20型 93E35型 49甲10 49升20 PDF格式BibTeX公司 XML格式引用 \textit{H.Zhang},J.应用。数学。计算。69,编号3,2741--2760(2023;Zbl 1521.93211) 全文: 内政部 arXiv公司
盖尔·阿希姆。;托马斯·布伦施韦勒 后向归纳悖论的认识论基础。 (英语) Zbl 1521.91034号 游戏经济。行为。 141503-514(2023年)。MSC公司:91A26型 91A18号 PDF格式BibTeX公司 XML格式引用 \textit{G.B.Asheim}和\textit{T.Brunnschweiler},游戏经济。行为。141503--514(2023年;Zbl 1521.91034) 全文: 内政部 OA许可证
Jaeok公园;Yun、Doo Hyung 战略游戏中的可能性信念。 (英语) Zbl 1521.91036号 理论决策。 95,第2期,205-228(2023)。MSC公司:91A26型 91B06型 PDF格式BibTeX公司 XML格式引用 \textit{J.Park}和\textit{D.H.Yun},《理论决定》。95,第2号,205-228(2023;Zbl 1521.91036) 全文: 内政部
曾宪林;窦、李华;崔金强 双线性耦合双子网零和博弈的分布式加速纳什均衡学习。 (英语) Zbl 07729619号 凯贝内提卡 59,第3期,418-436(2023)。MSC公司:91A10号 37号40 93甲14 PDF格式BibTeX公司 XML格式引用 \textit{X.Zeng}等人,Kybernetika 59,No.3,418--436(2023;Zbl 07729619) 全文: 内政部
潘云年;朱全燕 拥挤博弈中的中毒Wardrop均衡。 (英语) Zbl 1529.68067号 Fang,Fei(编辑)等,《安全决策与博弈论》。第13届国际会议,2022年10月26日至28日,美国宾夕法尼亚州匹兹堡,GameSec 2022。诉讼程序。查姆:斯普林格。莱克特。注释计算。科学。第13727页、第191-211页(2023年)。MSC公司:68平方米5 68T05型 91A65型 91A80型 PDF格式BibTeX公司 XML格式引用 \textit{Y.Pan}和\textit{Q.Zhu},Lect。注释计算。科学。13727191-211(2023年;Zbl 1529.68067) 全文: 内政部 arXiv公司
李恒儿;郑子战 强大的移动目标防御未知攻击:元增强学习方法。 (英语) Zbl 1529.68065号 Fang,Fei(编辑)等,《安全决策与博弈论》。第13届国际会议,2022年10月26日至28日,美国宾夕法尼亚州匹兹堡,GameSec 2022。诉讼程序。查姆:斯普林格。莱克特。注释计算。科学。13727, 107-126 (2023).MSC公司:68平方米5 68T05型 91A15型 91A80型 PDF格式BibTeX公司 XML格式引用 \textit{H.Li}和\textit{Z.Zheng},Lect。注释计算。科学。13727,107-126(2023;Zbl 1529.68065) 全文: 内政部
Nguyen、Thanh Hong;阿穆利亚·雅达夫 攻击者行为学习的风险:攻击者能否在不确定性下愚弄防御者? (英语) Zbl 1529.68066号 Fang,Fei(编辑)等人,安全决策与博弈论。第13届国际会议,2022年10月26日至28日,美国宾夕法尼亚州匹兹堡,GameSec 2022。诉讼程序。查姆:斯普林格。莱克特。注释计算。科学。13727, 3-22 (2023).MSC公司:68平方米5 68T05型 91A80型 PDF格式BibTeX公司 XML格式引用 \textit{T.H.Nguyen}和\textit{A.Yadav},莱克特。注释计算。科学。13727,3--22(2023;Zbl 1529.68066) 全文: 内政部
F.古洛。;D.曼达利奥。;塔加雷利,A。 关联聚类的组合多臂盗贼方法。 (英语) Zbl 1528.68340号 数据最小知识。发现。 37,第4期,1630-1691(2023)。MSC公司:68T05型 05C22号 62H30型 91年46月 PDF格式BibTeX公司 XML格式引用 \textit{F.Gullo}等人,Data Min.Knowl。发现。37,第4号,1630--1691(2023;Zbl 1528.68340) 全文: 内政部 OA许可证
新浪阿雷菲扎德;阿雷菲扎德,萨迪;埃特萨米,S.拉苏尔;Sadegh博洛基 博弈中动力学的稳健性:一种收缩映射分解方法。 (英语) Zbl 1520.91012号 Automatica公司 155,文章ID 111142,12 p.(2023)。MSC公司:91A10号 91A26型 91A20型 91B54号 91A80型 PDF格式BibTeX公司 XML格式引用 \textit{S.Arefizadeh}等人,Automatica 155,文章ID 111142,12页(2023年;Zbl 1520.91012) 全文: 内政部 arXiv公司
马克西米利安·日尔曼;范惠恩;泽维尔·沃林 控制州约束McKean-Vlasov方程的水平集方法:应用于可再生能源存储和投资组合选择。 (英语) Zbl 1518.49045号 数字。代数控制优化。 13,编号3-4,555-582(2023)。MSC公司:49号80 49M99型 68T07型 93E20型 49J55型 第49页第25页 90立方厘米 65岁15岁 35K55型 PDF格式BibTeX公司 XML格式引用 \textit{M.Germain}等人,数字。代数控制优化。13,编号3--4,555--582(2023;Zbl 1518.49045) 全文: 内政部 arXiv公司
P.Jean-Jacques,赫林斯;安娜·莫利昂;文森特·范内特尔博什 通过调解实现社会合理化。 (英语) Zbl 1520.91071号 动态。游戏应用程序。 第2期第13期,440-461页(2023年)。MSC公司:91A26型 91A05型 PDF格式BibTeX公司 XML格式引用 \textit{P.J.J.Herings}等人,戴恩。游戏应用程序。13,第2号,440-461(2023;Zbl 1520.91071) 全文: 内政部 OA许可证
丹尼尔·高尔勒 使用因果机器学习分析不对称飞镖比赛的内在优势。 (英语) Zbl 1520.91016号 安·Oper。研究。 325,第1号,649-679(2023)。MSC公司:91A10号 91A20型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{D.Goller},Ann.Oper。325号决议,第1号,649--679(2023年;Zbl 1520.91016) 全文: 内政部 arXiv公司 OA许可证
戈麦斯、迪奥戈;朱利安·古铁雷斯;马修·劳里埃 价格形成模型的机器学习架构。 (英语) Zbl 1515.35277号 申请。数学。最佳方案。 88,第1号,第23号论文,41页(2023年)。MSC公司:89年第35季度 49号80 68T07型 PDF格式BibTeX公司 XML格式引用 \textit{D.Gomes}等人,应用。数学。最佳方案。88,第1号,第23号论文,第41页(2023年;Zbl 1515.35277) 全文: 内政部 arXiv公司
弗朗西斯科·佐丹奴 关于非原子路由游戏中社交学习的说明。 (英语) Zbl 1525.91057号 操作。Res.Lett公司。 51,第3号,259-265(2023)。MSC公司:91A43型 91A26型 91A80型 PDF格式BibTeX公司 XML格式引用 \文本{F.佐丹奴},Oper。Res.Lett公司。51,第3号,259--265(2023;Zbl 1525.91057) 全文: 内政部
卡米娜·菲尔斯特罗姆 数学建模的选定主题:机器学习和拔河比赛。 (英语) Zbl 1515.68014号 乌普萨拉数学论文127.乌普萨拉大学数学系(Diss.)(ISBN 978-91-506-2998-9)。第41页。,开放存取(2023年)。MSC公司:68-02 35-02 91-02 35K65型 35兰特 91年第35季度 68T05型 68T07型 91A15型 91B84号 91G10型 PDF格式BibTeX公司 XML格式引用 \textit{C.Fjellström},数学建模选定主题:机器学习和拔河比赛。乌普萨拉大学数学系(Diss.)(2023;Zbl 1515.68014) 全文: 链接
保罗·加莱亚齐;约翰内斯·马蒂 游戏中的选择结构。 (英语) Zbl 1519.91047号 游戏经济。行为。 140, 431-455 (2023)。MSC公司:91A35型 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{P.Galeazi}和\textit{J.Marti},游戏经济。行为。140、431--455(2023年;Zbl 1519.91047) 全文: 内政部 arXiv公司
崔志伟 将摩擦、社会协调和进化速度联系起来。 (英语) Zbl 1519.91017号 游戏经济。行为。 140, 410-430 (2023)。MSC公司:91A12号机组 91A26型 91天30分 PDF格式BibTeX公司 XML格式引用 \textit{Z.Cui},游戏经济。行为。140410-430(2023年;Zbl 1519.91017) 全文: 内政部 OA许可证
Martirosyan,E。;M·曹。 线性二次零和微分对策辨识的逆强化学习。 (英语) Zbl 1519.91040号 系统。控制信函。 172,文章ID 105438,8 p.(2023)。MSC公司:91A23型 91A10号 49甲10 49号45 49号70 PDF格式BibTeX公司 XML格式引用 \textit{E.Martirosyan}和\textit{M.Cao},系统。控制信函。172,文章ID 105438,8 p.(2023;Zbl 1519.91040) 全文: 内政部 OA许可证
拉米雷斯,斯特凡尼;劳伦斯·范勃兰登堡。;达里奥·鲍索 参数具有时间依赖性和不确定性的协调补货博弈和学习。 (英语) Zbl 1525.91051号 动态。游戏应用程序。 13,编号1,326-352(2023)。 审核人:费尔南多·托姆(巴伊亚·布兰卡) MSC公司:91A26型 91A27型 PDF格式BibTeX公司 XML格式引用 \textit{S.Ramirez}等人,Dyn。游戏应用程序。13,编号1,326--352(2023;Zbl 1525.91051) 全文: 内政部 OA许可证
Soham R.法德。;文卡特·阿南塔拉姆 在具有累积前景理论偏好的游戏中学习。 (英语) Zbl 1516.91017号 动态。游戏应用程序。 13,编号1,265-306(2023)。MSC公司:91A26型 91A20型 91B16号 PDF格式BibTeX公司 XML格式引用 \textit{S.R.Phade}和\textit{V.Anantharam},Dyn。游戏应用程序。13,编号1,265--306(2023;Zbl 1516.91017) 全文: 内政部 arXiv公司
菲利普·布朗。;Joshua H·西顿。;杰森·马登。 健壮的网络多代理优化:设计代理以修复其自身的效用函数。 (英语) Zbl 1519.91044号 动态。游戏应用程序。 第13期,第1期,187-207(2023)。MSC公司:91A26型 91A06型 91B06型 91B16号 PDF格式BibTeX公司 XML格式引用 \textit{P.N.Brown}等人,Dyn。游戏应用程序。13,编号1,187--207(2023;Zbl 1519.91044) 全文: 内政部
毛伟超;塔梅尔·巴沙尔 分散广义和马尔可夫对策中有效的强化学习。 (英语) Zbl 1519.91029号 动态。游戏应用程序。 13,第1号,165-186(2023)。MSC公司:91A15型 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{W.Mao}和\textit{T.Bašar},Dyn。游戏应用程序。13,编号1,165--186(2023;Zbl 1519.91029) 全文: 内政部 arXiv公司
乌兹·扎曼(uz Zaman)、穆罕默德·阿内克(Muhammad Aneeq);埃里克·米林;塔梅尔·巴沙尔 多种群非平稳离散时间线性二次平均场博弈的强化学习。 (英语) Zbl 1519.91036号 动态。游戏应用程序。 13,编号1,118-164(2023)。MSC公司:91A16型 91A26型 91A43型 93E20型 PDF格式BibTeX公司 XML格式引用 \textit{M.A.uz Zaman}等人,Dyn。游戏应用程序。13,编号1,118--164(2023;Zbl 1519.91036) 全文: 内政部
贝凯·阿纳塔奇;坎德哈·卡里克西兹;萨尔迪,纳西 正规场上比赛中的Q-学习。 (英语) Zbl 1519.91032号 动态。游戏应用程序。 13,编号1,89-117(2023)。MSC公司:91A16型 91A26型 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{B.Anahtarci}等人,Dyn。游戏应用程序。13,编号1,89-117(2023;Zbl 1519.91032) 全文: 内政部 arXiv公司 链接
西尔万·索林 优化和博弈论中的连续时间学习算法。 (英语) 兹比尔1519.91027 动态。游戏应用程序。 13,编号1,3-24(2023)。MSC公司:91A14号机组 91A26型 90C25型 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{S.Sorin},戴恩。游戏应用程序。13、编号1、3——24(2023;Zbl 1519.91027) 全文: 内政部
Sören Bartels;尼科·韦伯 参数学习和分数微分算子:在正则化图像去噪和分解问题中的应用。 (英语) Zbl 1516.94003号 数学。控制关系。领域 13,编号1,35-62(2023)。MSC公司:94A08型 68单位10 65N12号 65号35 49号70 PDF格式BibTeX公司 XML格式引用 \textit{S.Bartels}和\textit{N.Weber},数学。控制关系。字段13,编号1,35--62(2023;Zbl 1516.94003) 全文: 内政部 arXiv公司
亚历山大·泽尔曼;斯特凡妮娅·佩特拉;克里斯托夫·施诺尔 学习用于图像标记的线性化分配流。 (英语) Zbl 07694852号 数学杂志。成像视觉。 65,第1期,164-184(2023)。MSC公司:68倍 94-XX年 34立方厘米 62华氏35 68单位10 68T05型 91A22型 PDF格式BibTeX公司 XML格式引用 \textit{A.Zeilmann}等人,《数学杂志》。成像视觉。65,编号1,164--184(2023;Zbl 07694852) 全文: 内政部 arXiv公司 OA许可证
李胜波·埃本 序列决策和最优控制的强化学习。 (英语) Zbl 1515.68005号 新加坡:Springer(ISBN 978-981-19-7783-1/hbk;978-981-9-7786-2/pbk;988-981-19-19-7784-8/电子书)。xxx,462页。(2023).MSC公司:68-01年 49升20 65二氧化碳 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{S.E.Li},序列决策和最优控制的强化学习。新加坡:Springer(2023;Zbl 1515.68005) 全文: 内政部
杰瑞德·切萨里;赖一郎·卡瓦伊;Yuji Shinozaki;山田俊弘 倒向随机微分方程的数值方法:综述。 (英语) Zbl 1515.65023号 普罗巴伯。Surv公司。 20, 486-567 (2023)。MSC公司:65立方米 60华氏35 65二氧化碳 93E20型 49升20 07年6月60日 68T07型 65-02 PDF格式BibTeX公司 XML格式引用 \textit{J.Chessari}等人,Probab。Surv公司。20486--567(2023年;Zbl 1515.65023) 全文: 内政部 arXiv公司 链接
徐,林;王林林;刘,肖;王浩 最佳有效寿命投资。 (英语) Zbl 1514.91177号 国际J.控制 96,编号1,48-57(2023)。MSC公司:91G10型 49升20 60J20型 PDF格式BibTeX公司 XML格式引用 \textit{L.Xu}等人,国际期刊控制96,No.1,48-57(2023;Zbl 1514.91177) 全文: 内政部
阿兰·本苏桑;韩嘉岳;Yam,Shaung Chi Phillip先生;周,向 基于值粒度的最优控制问题和机器学习算法的表述。 (英语) Zbl 1523.49031号 SIAM J.数字。分析。 61,第2期,973-994(2023)。MSC公司:49升20 49公里15 65克05 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{A.Bensoussan}等人,SIAM J.Numer。分析。61,编号2973-994(2023;兹bl 1523.49031) 全文: 内政部 arXiv公司
马修·劳里埃;帕格斯,吉勒斯;奥利维埃·皮罗内奥 渔捞控制问题上马尔科夫神经网络与动态规划的性能比较。 (英语) Zbl 1512.91087号 普罗巴伯。不确定。数量。风险 8,编号1,121-140(2023)。MSC公司:91磅76英寸 93E20型 49升20 68T07型 PDF格式BibTeX公司 XML格式引用 \textit{M.Laurière}等人,Probab。不确定。数量。风险8,第1号,121--140(2023年;Zbl 1512.91087) 全文: 内政部 arXiv公司
上田真彦 记忆——重复囚徒困境博弈中形成对称互补学习均衡的两种策略。 (英语) Zbl 1511.91016号 申请。数学。计算。 444,文章ID 127819,15 p.(2023)。MSC公司:91A20型 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{M.Ueda},应用程序。数学。计算。444,文章ID 127819,15 p.(2023;Zbl 1511.91016) 全文: 内政部 arXiv公司
阿夫鲁兹,瓦齐费丹;穆罕默德·伊扎迪 用于预测重复游戏中人类行为的策略学习动态图模型。 (英语) Zbl 1508.91040号 B.E.J.西奥。经济。 23,编号1,371-403(2023)。MSC公司:91A20型 91A26型 91A43型 PDF格式BibTeX公司 XML格式引用 \textit{A.Vazifedan}和\textit{M.Izadi},B.E.J.Theor。经济。23,第1号,371--403(2023;Zbl 1508.91040) 全文: 内政部
Izquierdo,Segismundo S。;路易斯·R·伊兹基尔多。 策略集在支付抽样下关闭。 (英语) Zbl 1508.91081号 游戏经济。行为。 138, 126-142 (2023)。MSC公司:91A26型 91A18号 91A05型 PDF格式BibTeX公司 XML格式引用 \textit{S.S.Izquierdo}和\textit{L.R.Izquiersdo},游戏经济。行为。138126-142(2023年;Zbl 1508.91081) 全文: 内政部 OA许可证
黄,珍;涂一东;方、海阳;王海;张亮;石凯波;何淑萍 非策略强化学习用于动态完全未知的离散马尔可夫跳跃线性系统的跟踪控制。 (英语) Zbl 1507.93140号 J.富兰克林研究所。 360,第3号,2361-2378(2023)。MSC公司:93C55美元 93E03型 93二氧化碳 49N90型 PDF格式BibTeX公司 XML格式引用 \textit{Z.Huang}等人,J.Franklin Inst.360,No.3,2361-2378(2023;Zbl 1507.93140) 全文: 内政部
尹、双双;吴建红;宋鹏飞 基于深度学习技术的最优控制及其在流行病模型中的应用。 (英语) Zbl 1508.92316号 数学杂志。生物。 86,第3号,第36号论文,第26页(2023年)。MSC公司:92天30分 49甲15 68T07型 49升20 PDF格式BibTeX公司 XML格式引用 \textit{S.Yin}等人,J.Math。生物学86,第3期,论文36,26页(2023;Zbl 1508.92316) 全文: 内政部
斯塔基,K。;牛顿,P.K。 使用最优控制强化学习模型的新型冠状病毒疫苗激励调度。 (英语) Zbl 1507.92061号 生理学D 445,文章ID 133613,11 p.(2023)。MSC公司:92C60型 91A22型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{K.Stuckey}和\textit{P.K.Newton},物理学D 445,文章ID 133613,11 P.(2023;Zbl 1507.92061) 全文: 内政部
科恩,马克斯·H。;卡林·贝尔塔 使用控制屏障功能进行基于模型的强化学习的安全探索。 (英语) Zbl 1505.93123号 Automatica公司 147,文章ID 110684,9 p.(2023)。MSC公司:93C40型 68T05型 93立方厘米 49升20 PDF格式BibTeX公司 XML格式引用 \textit{M.H.Cohen}和\textit{C.Belta},Automatica 147,文章ID 110684,9 p.(2023;Zbl 1505.93123) 全文: 内政部 arXiv公司
戈麦斯、迪奥戈;朱利安·古铁雷斯;马修·劳里埃 具有常见噪声的价格形成模型的机器学习架构。 arXiv:2305.17618 预印本,arXiv:2305.17618[math.OC](2023)。MSC公司:91A15型 91-08 68T07型 60 H10型 65立方厘米20 BibTeX公司 引用 \textit{D.Gomes}等人,“常见噪声价格形成模型的机器学习体系结构”,Preprint,arXiv:2305.17618[math.OC](2023) 全文: arXiv公司 OA许可证
文国兴;牛、本 一类高阶未知非线性动态系统基于强化学习的优化跟踪控制。 (英语) Zbl 07814147号 信息科学。 606, 368-379 (2022)。MSC公司:93立方厘米 93立方厘米 93B10型 49升12 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{G.Wen}和\textit{B.Niu},信息科学。606368-379(2022年;Zbl 07814147) 全文: 内政部
玛尔塔·利普尼卡;安德烈·诺瓦科夫斯基 用于近似观测集概率分布的最优控制。 (英语) Zbl 07812740号 数学。方法应用。科学。 45,编号17,10659-10674(2022)。MSC公司:68T05型 49升20 68T07型 PDF格式BibTeX公司 XML格式引用 \textit{M.Lipnicka}和\textit{A.Nowakowski},数学。方法应用。科学。45,编号17,10659--10674(2022;Zbl 07812740) 全文: 内政部
冉、燕;邱晓玲 基于Ekeland变分原理的一类平衡问题解集的稳定性研究及应用。 (中文。英文摘要) 兹比尔07800921 数学学报。申请。罪。 45,编号1,1-18(2022)。MSC公司:47甲14 54C60个 91A10号 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{Y.Ran}和\textit{X.Qiu},《数学学报》。申请。罪。45,编号1,1--18(2022;Zbl 07800921) 全文: 链接
唐玉红;杨雄 非线性约束系统的强化学习鲁棒跟踪控制。 (英语) Zbl 1529.93016号 国际J鲁棒非线性控制 32,编号18,9902-9919(2022)。MSC公司:93B35型 93立方厘米 93C40型 49升20 PDF格式BibTeX公司 XML格式引用 \textit{Y.Tang}和\textit{X.Yang},Int.J.鲁棒非线性控制32,No.18,9902--9919(2022;Zbl 1529.93016) 全文: 内政部
王、丁;任、金;哈,明明 基于值迭代的仿射非线性最优控制涉及容许性讨论。 (英语) Zbl 1528.49024号 国际J鲁棒非线性控制 32,编号13,7290-7303(2022)。MSC公司:49升20 93天20分 PDF格式BibTeX公司 XML格式引用 \textit{D.Wang}et al.,Int.J.鲁棒非线性控制32,编号137290-7303(2022;Zbl 1528.49024) 全文: 内政部