文档搜索结果-zbMATH Open

×

找到1637个文档（结果1-100）

最新的引文关联

崔晓红;陈嘉玉;崔，杨;徐素安

基于非策略积分强化学习的两人非线性Stackelberg微分对策。（英语） Zbl 07852134号

J.富兰克林研究所。 361，第8号，文章ID 106812，第18页（2024）。

MSC公司：91A05型 91A23型 91A65型 49号70 93天20分

PDF格式 BibTeX公司 XML格式引用

全文：内政部

马，肖;元，元

基于非策略无模型强化学习的线性离散时间系统鲁棒分层对策。（英语） Zbl 07852036号

J.富兰克林研究所。 361，第7号，文章ID 106711，17页（2024）。

MSC公司：91A65型 93C55美元 93二氧化碳

PDF格式 BibTeX公司 XML格式引用

全文：内政部

高，袁;刘建国;李武晨

具有非线性激活的有限状态平均场对策的主方程。（英语） Zbl 07841474号

离散连续。动态。系统。，序列号。B类 29，第7期，2837-2879（2024）。

MSC公司：49号80 49升12 35层21 60J20型 34K35型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

亚瑟·多尔戈波洛夫

囚犯困境中的强化学习。（英语） Zbl 07839933号

游戏经济。行为。 144, 84-103 (2024)。

MSC公司：91A22型 91A05型 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

刘璐萍;贾文胜

具有有限状态和动作空间的平均场对策的适定性。（英语） Zbl 07839676号

J.优化。理论应用。 201，编号1，36-53（2024）。

MSC公司：49公里40 49号80 第91页第13页 91A25型 91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

马里奥·列斐伏尔

两个吸收屏障之间的受控二维马尔可夫链。（英语） Zbl 07834226号

J.差异Equ。申请。 30，编号3，278-286（2024）。

MSC公司：93E20型 93C55美元 49升20 60J20型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

奥尔加·克里沃罗特科;谢尔盖·卡巴尼金

新冠肺炎传播建模的人工智能。（英语） Zbl 07829446号

J.逆病态概率。 32，第2号，297-332（2024）。

MSC公司：92天30分 34A55型 65立方米 68T07型 91A16型 49升12

PDF格式 BibTeX公司 XML格式引用

全文：内政部

赵平;李学荣;王寿阳

从决策角度理解人机交互：基于围棋游戏的实证研究。（英语） Zbl 07827321号

J.系统。科学。复杂。 37，第2期，647-667（2024）。

MSC公司：91B06型 91A35型 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

韩秀梅;赵旭东;王、丁;王伯辉

基于事件触发的在线积分强化学习用于未知约束非线性系统的最优控制。（英语） Zbl 07827183号

国际J.控制 97，第2期，213-225（2024）。

MSC公司：93元65角 93立方厘米 49升12

PDF格式 BibTeX公司 XML格式引用

全文：内政部

郑文倩;杨雄

基于强化学习的饱和非线性系统鲁棒动态事件触发控制。（英语） Zbl 07821257号

国际J鲁棒非线性控制 34，编号4，2659-2674（2024）。

MSC公司：93B35型 93元65角 49升12 93立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部

吕永丰;赵军;李蓉;任雪梅

基于自适应积分强化学习Q函数的具有未知扰动的多输入系统鲁棒最优控制。（英语） Zbl 07821188号

国际J鲁棒非线性控制 34，第6号，4234-4251（2024）。

MSC公司：93C40型 93B35型 49升12 91A10号 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

兰、雪晶;严佳培;何树德;赵志佳;邹涛

具有碰撞避免的多智能体系统的分布式协同强化学习。（英语） Zbl 07821102号

国际J鲁棒非线性控制 34，第1号，567-585（2024）。

MSC公司：93甲16 49升20

PDF格式 BibTeX公司 XML格式引用

全文：内政部

郭欣;奥斯曼·蒙吉德

GAN训练：游戏和随机控制方法。（英语） Zbl 07818735号

数学。财务 34，第2期，522-556（2024年）。

MSC公司：91G80型 68T05型 91A15型 93E20型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

拉玛（Rama）;熊、伟

经销商市场中做市算法的动态：学习和默契共谋。（英语） Zbl 07818734号

数学。财务 34，第2期，467-521（2024）。

MSC公司：91G15型 91A15型 91A80型 91年第35季度

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

埃特萨米，S.拉苏尔

学习具有独立链的（n）人随机博弈的平稳纳什均衡策略。（英语） Zbl 07814424号

SIAM J.控制优化。 62，第2期，799-825（2024）。

MSC公司：91A15型 91A11号机组 91A68型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

Mertikopoulos，Panayotis公司;谢亚萍;沃尔坎·塞弗尔

游戏中学习的统一随机近似框架。（英语） Zbl 07807883号

数学。程序。 203，编号1-2（B），559-609（2024）。

MSC公司：91A26型 91A68型 91A15型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司哈尔

OA许可证

何康辉;石胜凌;van den Boom，吨;巴特·德·舒特

约束线性系统的近似动态规划：分段二次近似方法。（英语） Zbl 07803912号

Automatica公司 160，文章ID 111456，9 p.（2024）。

MSC公司：93B45码 49升20 49甲10

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

OA许可证

唐、清;宋家豪

潜在平均场博弈中的最优策略学习：平滑策略迭代算法。（英语） Zbl 1532.91014号

SIAM J.控制优化。 62，第1号，351-375（2024）。

MSC公司：91A16型 91A26型 2006年6月65日

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

贝丽妮斯·安妮·诺依曼

具有有限状态和动作空间的平均场对策的近视调整过程。（英语） Zbl 1531.91029号

国际博弈论 53，第1期，159-195（2024）。

MSC公司：91A16型 91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

OA许可证

弗莱德里克·法利诺夫斯基;Mertikopoulos，Panayotis公司

关于复制因子动力学的离散时间起源：从收敛到不稳定和混沌。 arXiv:2402.09824

预印本，arXiv:2402.09824[math.DS]（2024）。

MSC公司：91A22型 91A26型第37页 37号40 91A14号机组

BibTeX公司引用

全文： arXiv公司

OA许可证

奥利维尔·博卡诺夫斯基;泽维尔·沃林

微分对策的神经网络。 arXiv:2402.02792

预印本，arXiv:2402.02792[math.OC]（2024）。

MSC公司：35层21 49升20 68T07型

BibTeX公司引用

全文： arXiv公司

OA许可证

埃兰·什马亚;布鲁诺·齐利奥托

平均场博弈中的贝叶斯学习。 arXiv公司：2401.17696

预印本，arXiv:2401.17696[math.OC]（2024）。

MSC公司：91A16型 91A27型 91A26型

BibTeX公司引用

全文： arXiv公司

OA许可证

黄宗生;白、薇薇;李铁山;龙，岳;陈，C.L.菲利普;梁红晶;杨汉清

具有规定性能的严格反馈非线性系统的自适应强化学习最优跟踪控制。（英语） Zbl 07834481号

信息科学。 621, 407-423 (2023)。

MSC公司：93C40型 49升20 93B52号 93立方厘米 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

邱、灿;朱亚辉;张康浩;于登秀;菲利普·陈，C.L。

持续行动与数据驱动的补偿网络和有限的学习能力重复了困境。（英语） Zbl 07829676号

信息科学。 632, 516-528 (2023)。

MSC公司：91A22型 91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

谭，少林;陶，叶;冉茂鹏;刘浩

单调博弈中具有异质学习率的分布投影梯度博弈的收敛性。（英语） Zbl 07827712号

系统。控制信函。 182，文章ID 105654，8 p.（2023）。

MSC公司：91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

张殿峰;姚莹;吴兆景

基于消失粘性法的输入约束多智能体系统的强化学习最优同步控制。（英语） Zbl 07826353号

信息科学。 637，文章ID 118949，19 p.（2023）。

MSC公司：93D99型 93甲16 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

阿索曼·奥兹达格勒;穆罕默德·沙因。;张凯庆

随机博弈中的独立学习。（英语） Zbl 07822596号

Beliaev，Dmitry（编辑）等人，《2022年国际数学家大会》，ICM 2022，芬兰赫尔辛基，虚拟，2022年7月6日至14日。第7卷。第15-20节。柏林：欧洲数学学会（EMS）。5340-5373 (2023).

MSC公司：91A15型 91A26型 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

OA许可证

崔晓红;彭彬彬;王斌瑞;王丽娜

未知连续非线性系统非零和跟踪博弈的事件触发神经经验重放学习。（英语） Zbl 07816399号

国际J鲁棒非线性控制 33，编号12，6553-6575（2023）。

MSC公司：93元65角 93C40型 90立方厘米 93立方厘米 91A05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

伯努瓦·杜沃克尔;Mertikopoulos，Panayotis公司;马蒂亚斯·斯塔迪格尔;弗默伦，德里斯

时变博弈中的多智能体在线学习。（英语） Zbl 07808972号

数学。操作。研究。 48，编号2，914-941（2023）。

MSC公司：91A26型 91A20型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

郭欣;胡安然;徐仁元;张俊姿

一个学习平均场游戏的一般框架。（英语） Zbl 07808962号

数学。操作。研究。 48，第2期，656-686（2023）。

MSC公司：91A16型 68T05型 91A15型 91B26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

谢巧敏;陈玉东;王兆然;杨卓然

利用函数逼近和相关均衡学习零和同时移动马尔可夫对策。（英语） Zbl 07808945号

数学。操作。研究。 48，编号1，433-462（2023）。

MSC公司：68T05型 91A15型 91A25型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

温伯格，K。;斯泰尼尔，L。;康蒂，S。;M.奥尔蒂斯。

计算力学中的数据驱动游戏。（英语） Zbl 07804963号

计算。方法应用。机械。工程师。 417，A部分，文章ID 116399，第27页（2023）。

MSC公司：74S05号 74S99型 91A10号

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

陈林;董超;他，舒德;戴世禄

基于actor-critic学习结构的无人机自适应最优编队控制。（英语） Zbl 1532.93155号

国际J鲁棒非线性控制 33，编号8，4504-4522（2023）。

MSC公司：93C40型 93C85号 93甲16 49N90型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

赵明明;王、丁;乔俊飞;胡凌志

一类非线性非仿射系统的广义N步值梯度学习最优轨迹跟踪控制。（英语） Zbl 1532.93204号

国际J鲁棒非线性控制 33，第6号，3471-3490（2023）。

MSC公司：93C40型 93立方厘米 49升20

PDF格式 BibTeX公司 XML格式引用

全文：内政部

巴赫（Christian W。;杰雷米·卡贝萨

词汇学同意不同意和完美平衡。（英语）兹比尔07799770

数学杂志。经济。 109，文章ID 102908，17 p.（2023）。

MSC公司：91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

巴蒂加利，P。;Catonini，E。;J.马尼利。

连续博弈中的信念变化、理性和战略推理。（英语）兹伯利07786816

游戏经济。行为。 142, 527-551 (2023)。

MSC公司：91A20型 91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

恩里克·卡萨雷斯。;瓜达卢佩岛玛丽亚·萨拉查

开放经济中的最佳经济政策和增长。（英语） Zbl 1530.91375号

J.戴恩。游戏 10，第4号，287-303（2023）。

MSC公司：91磅62 91B66型 91B64型 49N90型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

Bosen Lian;薛文倩;刘易斯，弗兰克·L。

异构多层次模仿学习。（英语） Zbl 1530.91018号

控制理论技术。 21，第3号，281-291（2023）。

MSC公司：91A06型 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

皮埃尔·拉维涅;洛朗·菲佛

潜在平均场对策中的广义条件梯度和学习。（英语） Zbl 07771776号

申请。数学。最佳方案。 88，第3期，第89号论文，36页（2023年）。

MSC公司：90摄氏52度 91A16型 91A26型 91B06型 49K20型 35层21 91年第35季度

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司哈尔

奥利维尔·博卡诺夫斯基;艾薇尔·普罗斯特;泽维尔·沃林

一阶HJB方程的神经网络及其在带有障碍项的波前传播中的应用。（英语） Zbl 1527.35140号

序号部分差异。埃克。申请。 4，第5号，第45号论文，36页（2023年）。

MSC公司：35层21 49升20 68T07型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司哈尔

尼尔·卡马德拉;阿纳·布西奇;肖恩·梅恩（Sean P.Meyn）。

Kullback-Leibler二次最优控制。（英语） Zbl 07764830号

SIAM J.控制优化。 61，第5期，3234-3258（2023）。

MSC公司：90立方厘米 90立方厘米 60J20型 90C25型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

朱利奥·克莱姆普纳。

马尔可夫博弈中用于计算近最优策略的贝叶斯强化学习方法。（英语） Zbl 1527.91013号

安。数学。Artif公司。智力。 91，编号5，675-690（2023）。

MSC公司：91A15型 91A27型 68T05型 60J20型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

张琪;杨，杨;宋雪;谢晓然;朱乃波;刘志

基于自适应动态规划的动态未知双积分多智能体系统的最优一致性控制。（英语） Zbl 1531.93395号

最佳方案。控制应用程序。方法 44，第5期，2883-2899（2023）。

MSC公司：93D50型 93甲16 93C40型 49升20

PDF格式 BibTeX公司 XML格式引用

全文：内政部

秦、燕;曹、梁;鲁，青;潘英南

基于强化学习的外部扰动下严格反馈非线性系统的优化反推控制。（英语）兹比尔1531.93132

最佳方案。控制应用程序。方法 44，第5期，2724-2743（2023）。

MSC公司：93B52号 93立方厘米 93C73号 49N90型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

卢，杨;李文章;张兴龙;Xu、Xin

连续时间后退地平线强化学习及其在自动地面车辆路径跟踪控制中的应用。（英语） Zbl 1531.93312号

最佳方案。控制应用程序。方法 44，第3期，1129-1147（2023）。

MSC公司：93C85号 93立方厘米 49升20 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

魏庆来;刘玉佳;陆景伟;凌，君;振华栾;陈明良

一种用于锅炉-涡轮机系统的最优跟踪控制的新的积分批评学习。（英语） Zbl 1531.93217号

最佳方案。控制应用程序。方法 44，第2期，830-845（2023年）。

MSC公司：93C40型 93立方厘米 49升20 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

杨雄;周英江;高忠科

具有非对称饱和执行器的非线性系统鲁棒镇定的强化学习。（英语） Zbl 1525.93343号

神经网络。 158, 132-141 (2023)。

MSC公司：93D21号 93立方厘米 93C40型 49升20

PDF格式 BibTeX公司 XML格式引用

全文：内政部

蒋学英;黄敏;邝汉斌;史惠远;王兴伟;Lee、Loo Hay

通过非策略2D游戏（Q）学习改进了批处理过程的无模型（H）控制。（英语） Zbl 1526.93042号

国际J.控制 96，第10号，2447-2463（2023）。

MSC公司：93B36型 91A10号 91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

卡尔·库尼什;多纳托·瓦拉斯

有限时域控制问题的最优多项式反馈律。（英语） Zbl 07750285号

计算。数学。申请。 148, 113-125 (2023)。

MSC公司：49升20 49号35 65克05 35层21 第49页第25页

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

OA许可证

Hoppe Wewetzer，Heidrun公司;乔治·卡塞诺斯;埃姆雷·奥兹德诺伦

公共与私人学习下竞争对科学进步的影响。（英语） Zbl 1527.91036号

《经济学杂志》。理论 212，文章ID 105702，35 p.（2023）。

MSC公司：91A55型 91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

皮尔保罗·巴蒂加利;法布里西奥·帕内比安科;Pin，保罗

网络游戏中的学习与自我确认平衡。（英语） Zbl 1527.91034号

《经济学杂志》。理论 212，文章ID 105700，42 p.（2023）。

MSC公司：91A43型 91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

OA许可证

贝尔亚夫斯基，G.I。;Danilova，N.V.公司。;乌戈林茨基，G.A。

协调投资管理利益的模式。（英语） Zbl 1522.91207号

国际博弈论评论。 25，第1号，文章ID 2350002，12 p.（2023）。

MSC公司：91G10型 91A05型 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

波维达，豪尔赫一世。;米罗斯拉夫·克里斯蒂奇;塔梅尔·巴沙尔

时变网络中的固定时间纳什均衡搜索。（英语） Zbl 07742225号

IEEE传输。自动。控制 68，第4期，1954-1969（2023）。

MSC公司：93至XX

PDF格式 BibTeX公司 XML格式引用

全文：内政部

巴伊拉克塔尔，埃尔罕;陈涛

模型不确定性下的非参数自适应鲁棒控制。（英语）兹比尔1522.49016

SIAM J.控制优化。 61，编号5，2737-2760（2023）。

MSC公司：49J55型 60J99型 60J10型 49升20 93E20型 93E35型 60G15年 65克05 90立方厘米 90立方厘米 91G10型 91G60型 62G05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

严锐;张伟贤;邓瑞良;段晓明;石宗英;钟毅生

通过最佳和更好的响应在两层对称游戏中进行评估和学习。（英语） Zbl 1521.91004号

信息科学。 647，文章ID 119459，16 p.（2023）。

MSC公司：91A05型 91A15型 91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

一种基于自适应动态规划的无限小时线性二次随机最优控制算法。（英语） Zbl 1521.93211号

J.应用。数学。计算。 69，编号3，2741-2760（2023）。

MSC公司：93E20型 93E35型 49甲10 49升20

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

盖尔·阿希姆。;托马斯·布伦施韦勒

后向归纳悖论的认识论基础。（英语） Zbl 1521.91034号

游戏经济。行为。 141503-514（2023年）。

MSC公司：91A26型 91A18号

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

Jaeok公园;Yun、Doo Hyung

战略游戏中的可能性信念。（英语） Zbl 1521.91036号

理论决策。 95，第2期，205-228（2023）。

MSC公司：91A26型 91B06型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

曾宪林;窦、李华;崔金强

双线性耦合双子网零和博弈的分布式加速纳什均衡学习。（英语） Zbl 07729619号

凯贝内提卡 59，第3期，418-436（2023）。

MSC公司：91A10号 37号40 93甲14

PDF格式 BibTeX公司 XML格式引用

全文：内政部

潘云年;朱全燕

拥挤博弈中的中毒Wardrop均衡。（英语） Zbl 1529.68067号

Fang，Fei（编辑）等，《安全决策与博弈论》。第13届国际会议，2022年10月26日至28日，美国宾夕法尼亚州匹兹堡，GameSec 2022。诉讼程序。查姆：斯普林格。莱克特。注释计算。科学。第13727页、第191-211页（2023年）。

MSC公司：68平方米5 68T05型 91A65型 91A80型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

李恒儿;郑子战

强大的移动目标防御未知攻击：元增强学习方法。（英语） Zbl 1529.68065号

Fang，Fei（编辑）等，《安全决策与博弈论》。第13届国际会议，2022年10月26日至28日，美国宾夕法尼亚州匹兹堡，GameSec 2022。诉讼程序。查姆：斯普林格。莱克特。注释计算。科学。13727, 107-126 (2023).

MSC公司：68平方米5 68T05型 91A15型 91A80型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

Nguyen、Thanh Hong;阿穆利亚·雅达夫

攻击者行为学习的风险：攻击者能否在不确定性下愚弄防御者？（英语） Zbl 1529.68066号

Fang，Fei（编辑）等人，安全决策与博弈论。第13届国际会议，2022年10月26日至28日，美国宾夕法尼亚州匹兹堡，GameSec 2022。诉讼程序。查姆：斯普林格。莱克特。注释计算。科学。13727, 3-22 (2023).

MSC公司：68平方米5 68T05型 91A80型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

F.古洛。;D.曼达利奥。;塔加雷利，A。

关联聚类的组合多臂盗贼方法。（英语） Zbl 1528.68340号

数据最小知识。发现。 37，第4期，1630-1691（2023）。

MSC公司：68T05型 05C22号 62H30型 91年46月

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

新浪阿雷菲扎德;阿雷菲扎德，萨迪;埃特萨米，S.拉苏尔;Sadegh博洛基

博弈中动力学的稳健性：一种收缩映射分解方法。（英语） Zbl 1520.91012号

Automatica公司 155，文章ID 111142，12 p.（2023）。

MSC公司：91A10号 91A26型 91A20型 91B54号 91A80型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

马克西米利安·日尔曼;范惠恩;泽维尔·沃林

控制州约束McKean-Vlasov方程的水平集方法：应用于可再生能源存储和投资组合选择。（英语） Zbl 1518.49045号

数字。代数控制优化。 13，编号3-4，555-582（2023）。

MSC公司：49号80 49M99型 68T07型 93E20型 49J55型第49页第25页 90立方厘米 65岁15岁 35K55型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

P.Jean-Jacques，赫林斯;安娜·莫利昂;文森特·范内特尔博什

通过调解实现社会合理化。（英语） Zbl 1520.91071号

动态。游戏应用程序。第2期第13期，440-461页（2023年）。

MSC公司：91A26型 91A05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

丹尼尔·高尔勒

使用因果机器学习分析不对称飞镖比赛的内在优势。（英语） Zbl 1520.91016号

安·Oper。研究。 325，第1号，649-679（2023）。

MSC公司：91A10号 91A20型 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

OA许可证

戈麦斯、迪奥戈;朱利安·古铁雷斯;马修·劳里埃

价格形成模型的机器学习架构。（英语） Zbl 1515.35277号

申请。数学。最佳方案。 88，第1号，第23号论文，41页（2023年）。

MSC公司：89年第35季度 49号80 68T07型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

弗朗西斯科·佐丹奴

关于非原子路由游戏中社交学习的说明。（英语） Zbl 1525.91057号

操作。Res.Lett公司。 51，第3号，259-265（2023）。

MSC公司：91A43型 91A26型 91A80型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

卡米娜·菲尔斯特罗姆

数学建模的选定主题：机器学习和拔河比赛。（英语） Zbl 1515.68014号

乌普萨拉数学论文127.乌普萨拉大学数学系（Diss.）（ISBN 978-91-506-2998-9）。第41页。，开放存取（2023年）。

MSC公司：68-02 35-02 91-02 35K65型 35兰特 91年第35季度 68T05型 68T07型 91A15型 91B84号 91G10型

PDF格式 BibTeX公司 XML格式引用

全文：链接

保罗·加莱亚齐;约翰内斯·马蒂

游戏中的选择结构。（英语） Zbl 1519.91047号

游戏经济。行为。 140, 431-455 (2023)。

MSC公司：91A35型 91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

将摩擦、社会协调和进化速度联系起来。（英语） Zbl 1519.91017号

游戏经济。行为。 140, 410-430 (2023)。

MSC公司：91A12号机组 91A26型 91天30分

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

Martirosyan，E。;M·曹。

线性二次零和微分对策辨识的逆强化学习。（英语） Zbl 1519.91040号

系统。控制信函。 172，文章ID 105438，8 p.（2023）。

MSC公司：91A23型 91A10号 49甲10 49号45 49号70

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

拉米雷斯，斯特凡尼;劳伦斯·范勃兰登堡。;达里奥·鲍索

参数具有时间依赖性和不确定性的协调补货博弈和学习。（英语） Zbl 1525.91051号

动态。游戏应用程序。 13，编号1，326-352（2023）。

审核人：费尔南多·托姆（巴伊亚·布兰卡）

MSC公司：91A26型 91A27型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

Soham R.法德。;文卡特·阿南塔拉姆

在具有累积前景理论偏好的游戏中学习。（英语） Zbl 1516.91017号

动态。游戏应用程序。 13，编号1，265-306（2023）。

MSC公司：91A26型 91A20型 91B16号

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

菲利普·布朗。;Joshua H·西顿。;杰森·马登。

健壮的网络多代理优化：设计代理以修复其自身的效用函数。（英语） Zbl 1519.91044号

动态。游戏应用程序。第13期，第1期，187-207（2023）。

MSC公司：91A26型 91A06型 91B06型 91B16号

PDF格式 BibTeX公司 XML格式引用

全文：内政部

毛伟超;塔梅尔·巴沙尔

分散广义和马尔可夫对策中有效的强化学习。（英语） Zbl 1519.91029号

动态。游戏应用程序。 13，第1号，165-186（2023）。

MSC公司：91A15型 91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

乌兹·扎曼（uz Zaman）、穆罕默德·阿内克（Muhammad Aneeq）;埃里克·米林;塔梅尔·巴沙尔

多种群非平稳离散时间线性二次平均场博弈的强化学习。（英语） Zbl 1519.91036号

动态。游戏应用程序。 13，编号1，118-164（2023）。

MSC公司：91A16型 91A26型 91A43型 93E20型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

贝凯·阿纳塔奇;坎德哈·卡里克西兹;萨尔迪，纳西

正规场上比赛中的Q-学习。（英语） Zbl 1519.91032号

动态。游戏应用程序。 13，编号1，89-117（2023）。

MSC公司：91A16型 91A26型 90立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司链接

西尔万·索林

优化和博弈论中的连续时间学习算法。（英语）兹比尔1519.91027

动态。游戏应用程序。 13，编号1，3-24（2023）。

MSC公司：91A14号机组 91A26型 90C25型 90立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部

Sören Bartels;尼科·韦伯

参数学习和分数微分算子：在正则化图像去噪和分解问题中的应用。（英语） Zbl 1516.94003号

数学。控制关系。领域 13，编号1，35-62（2023）。

MSC公司：94A08型 68单位10 65N12号 65号35 49号70

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

亚历山大·泽尔曼;斯特凡妮娅·佩特拉;克里斯托夫·施诺尔

学习用于图像标记的线性化分配流。（英语） Zbl 07694852号

数学杂志。成像视觉。 65，第1期，164-184（2023）。

MSC公司：68倍 94-XX年 34立方厘米 62华氏35 68单位10 68T05型 91A22型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

OA许可证

李胜波·埃本

序列决策和最优控制的强化学习。（英语） Zbl 1515.68005号

新加坡：Springer（ISBN 978-981-19-7783-1/hbk；978-981-9-7786-2/pbk；988-981-19-19-7784-8/电子书）。xxx，462页。(2023).

MSC公司：68-01年 49升20 65二氧化碳 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

杰瑞德·切萨里;赖一郎·卡瓦伊;Yuji Shinozaki;山田俊弘

倒向随机微分方程的数值方法：综述。（英语） Zbl 1515.65023号

普罗巴伯。Surv公司。 20, 486-567 (2023)。

MSC公司：65立方米 60华氏35 65二氧化碳 93E20型 49升20 07年6月60日 68T07型 65-02

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司链接

徐，林;王林林;刘，肖;王浩

最佳有效寿命投资。（英语） Zbl 1514.91177号

国际J.控制 96，编号1，48-57（2023）。

MSC公司：91G10型 49升20 60J20型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

阿兰·本苏桑;韩嘉岳;Yam，Shaung Chi Phillip先生;周，向

基于值粒度的最优控制问题和机器学习算法的表述。（英语） Zbl 1523.49031号

SIAM J.数字。分析。 61，第2期，973-994（2023）。

MSC公司：49升20 49公里15 65克05 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

马修·劳里埃;帕格斯，吉勒斯;奥利维埃·皮罗内奥

渔捞控制问题上马尔科夫神经网络与动态规划的性能比较。（英语） Zbl 1512.91087号

普罗巴伯。不确定。数量。风险 8，编号1，121-140（2023）。

MSC公司：91磅76英寸 93E20型 49升20 68T07型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

记忆——重复囚徒困境博弈中形成对称互补学习均衡的两种策略。（英语） Zbl 1511.91016号

申请。数学。计算。 444，文章ID 127819，15 p.（2023）。

MSC公司：91A20型 91A26型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

阿夫鲁兹，瓦齐费丹;穆罕默德·伊扎迪

用于预测重复游戏中人类行为的策略学习动态图模型。（英语） Zbl 1508.91040号

B.E.J.西奥。经济。 23，编号1，371-403（2023）。

MSC公司：91A20型 91A26型 91A43型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

Izquierdo，Segismundo S。;路易斯·R·伊兹基尔多。

策略集在支付抽样下关闭。（英语） Zbl 1508.91081号

游戏经济。行为。 138, 126-142 (2023)。

MSC公司：91A26型 91A18号 91A05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

黄，珍;涂一东;方、海阳;王海;张亮;石凯波;何淑萍

非策略强化学习用于动态完全未知的离散马尔可夫跳跃线性系统的跟踪控制。（英语） Zbl 1507.93140号

J.富兰克林研究所。 360，第3号，2361-2378（2023）。

MSC公司：93C55美元 93E03型 93二氧化碳 49N90型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

尹、双双;吴建红;宋鹏飞

基于深度学习技术的最优控制及其在流行病模型中的应用。（英语） Zbl 1508.92316号

数学杂志。生物。 86，第3号，第36号论文，第26页（2023年）。

MSC公司：92天30分 49甲15 68T07型 49升20

PDF格式 BibTeX公司 XML格式引用

全文：内政部

斯塔基，K。;牛顿，P.K。

使用最优控制强化学习模型的新型冠状病毒疫苗激励调度。（英语） Zbl 1507.92061号

生理学D 445，文章ID 133613，11 p.（2023）。

MSC公司：92C60型 91A22型 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

科恩，马克斯·H。;卡林·贝尔塔

使用控制屏障功能进行基于模型的强化学习的安全探索。（英语） Zbl 1505.93123号

Automatica公司 147，文章ID 110684，9 p.（2023）。

MSC公司：93C40型 68T05型 93立方厘米 49升20

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

戈麦斯、迪奥戈;朱利安·古铁雷斯;马修·劳里埃

具有常见噪声的价格形成模型的机器学习架构。 arXiv:2305.17618

预印本，arXiv:2305.17618[math.OC]（2023）。

MSC公司：91A15型 91-08 68T07型 60 H10型 65立方厘米20

BibTeX公司引用

全文： arXiv公司

OA许可证

文国兴;牛、本

一类高阶未知非线性动态系统基于强化学习的优化跟踪控制。（英语） Zbl 07814147号

信息科学。 606, 368-379 (2022)。

MSC公司：93立方厘米 93立方厘米 93B10型 49升12 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

玛尔塔·利普尼卡;安德烈·诺瓦科夫斯基

用于近似观测集概率分布的最优控制。（英语） Zbl 07812740号

数学。方法应用。科学。 45，编号17，10659-10674（2022）。

MSC公司：68T05型 49升20 68T07型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

冉、燕;邱晓玲

基于Ekeland变分原理的一类平衡问题解集的稳定性研究及应用。（中文。英文摘要）兹比尔07800921

数学学报。申请。罪。 45，编号1，1-18（2022）。

MSC公司：47甲14 54C60个 91A10号 91A26型

PDF格式 BibTeX公司 XML格式引用

全文：链接

唐玉红;杨雄

非线性约束系统的强化学习鲁棒跟踪控制。（英语） Zbl 1529.93016号

国际J鲁棒非线性控制 32，编号18，9902-9919（2022）。

MSC公司：93B35型 93立方厘米 93C40型 49升20

PDF格式 BibTeX公司 XML格式引用

全文：内政部

王、丁;任、金;哈，明明

基于值迭代的仿射非线性最优控制涉及容许性讨论。（英语） Zbl 1528.49024号

国际J鲁棒非线性控制 32，编号13，7290-7303（2022）。

MSC公司：49升20 93天20分

PDF格式 BibTeX公司 XML格式引用

全文：内政部

筛选结果依据…

文档类型

数据库

Zbl公司(1,626)
arXiv公司(11)

全部的前5名

作者

全部的前5名

序列号

全部的前5名

出版年份

全部的前3名

主字段

传记参考

全部的前3名

软件

© 2024FIZ卡尔斯鲁厄股份有限公司隐私政策法律声明条款和条件