王健;王伟;梁晓峰;左、赵 离散时间线性系统的有限维跟踪控制。 (英语) Zbl 07821078号 国际J鲁棒非线性控制 34,编号1,54-70(2024).MSC公司:93B36型 93C55美元 93二氧化碳 PDF格式BibTeX公司 XML格式引用 \textit{J.Wang}等人,国际鲁棒非线性控制34,No.1,54-70(2024;Zbl 07821078) 全文: 内政部
阿莫尔·耶鲁德卡尔;伊万格洛斯·查查鲁拉斯;卡门·德尔·维奇奥;索蒂里斯·莫斯科伊安尼斯 概率布尔控制网络的采样数据控制:深度强化学习方法。 (英语) Zbl 07834414号 信息科学。 619, 374-389 (2023).MSC公司:93元57 93元29角 93B70型 93E03型 90立方厘米 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{A.Yerudkar}等人,《信息科学》。619374-389(2023年;Zbl 07834414) 全文: 内政部
尼古拉斯·萨基;吉安·保罗·因切雷莫纳;安东尼拉·费拉拉 本质冗余机械臂的基于滑动模式的故障诊断和深度强化学习插件。 (英语) Zbl 07816531号 国际J鲁棒非线性控制 33,第15号,9109-9127(2023).MSC公司:93磅12英寸 93C85号 68T07型 93B52号 93B18号机组 PDF格式BibTeX公司 XML格式引用 \textit{N.Sacchi}等人,《国际鲁棒非线性控制》33,No.15,9109--9127(2023;Zbl 07816531) 全文: 内政部 OA许可证
勒内·卡莫纳;马修·劳里埃;谭宗军 无模型平均场强化学习:平均场MDP和平均场Q学习。 (英语) Zbl 07791537号 附录申请。普罗巴伯。 33,编号6B,5334-5381(2023).MSC公司:65个M12 65M99型 93E20型 93E25型 PDF格式BibTeX公司 XML格式引用 \textit{R.Carmona}等人,Ann.Appl。普罗巴伯。33,编号6B,5334-5381(2023;Zbl 07791537) 全文: 内政部 arXiv公司
黄,Runnan;秦成轩;李建玲;兰、雪晶 基于报酬修正深度Q网络的移动机器人在未知动态连续环境中的路径规划。 (英语) Zbl 1531.93308号 最佳方案。控制应用程序。方法 44,编号3,1570-1587(2023).MSC公司:93C85号 68T42型 PDF格式BibTeX公司 XML格式引用 \textit{R.Huang}等人,Optim。控制应用程序。方法44,No.3,1570--1587(2023;Zbl 1531.93308) 全文: 内政部
朱晓霞;袁欣;鲁东;王远大;孙昌银 离散时间多智能体系统基于邻域Q学习的一致性控制。 (英语) Zbl 1531.93396号 最佳方案。控制应用程序。方法 44,第3期,1475-1490(2023).MSC公司:93D50型 93C55美元 93甲16 PDF格式BibTeX公司 XML格式引用 \textit{X.Zhu}等人,Optim。控制应用程序。方法44,No.3,1475--1490(2023;Zbl 1531.93396) 全文: 内政部
李强;徐云君 基于降维的自适应动态规划用于离散非线性控制仿射系统的最优控制。 (英语) Zbl 1526.93121号 国际J.控制 96,第11号,2799-2811(2023).MSC公司:93C40型 49升20 93C55美元 93立方厘米 93D20型 PDF格式BibTeX公司 XML格式引用 \textit{Q.Li}和\textit{Y.Xu},国际期刊控制96,第11期,2799-2811(2023年;Zbl 1526.93121) 全文: 内政部
Michiaki Takizawa;小林,小一;Yuh Yamashita 使用强化学习设计概率布尔网络的降阶和固定控制器。 (英语) Zbl 07736230号 申请。数学。计算。 457,文章ID 128211,9 p.(2023).MSC公司:93亿 93立方厘米 94Cxx号 PDF格式BibTeX公司 XML格式引用 \textit{M.Takizawa}等人,应用。数学。计算。457,文章ID 128211,9 p.(2023;Zbl 07736230) 全文: 内政部
巴伊拉克塔尔,埃尔罕;阿里·德夫兰·卡拉 受控扩散过程的近似Q学习及其近似最优性。 (英语) Zbl 1521.93214号 SIAM J.数学。数据科学。 5,第3号,615-638(2023).MSC公司:第93页第35页 90立方厘米 93E20型 60J60型 PDF格式BibTeX公司 XML格式引用 \textit{E.Bayraktar}和\textit{A.D.Kara},SIAM J.数学。数据科学。5,编号3,615--638(2023;Zbl 1521.93214) 全文: 内政部 arXiv公司
安托万·莱斯根·兰德里;Duncan S·Callaway。 近似多智能体拟合Q迭代。 (英语) Zbl 1520.93019号 系统。控制信函。 177,文章ID 105563,10 p.(2023).MSC公司:93甲16 93E03型 90立方厘米 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{A.Lesage-Landry}和\textit{D.S.Callaway},系统。控制信函。177,文章ID 105563,10 p.(2023;Zbl 1520.93019) 全文: 内政部 arXiv公司
刘泽娇;刘,杨;阮启华;桂伟华 布尔网络的鲁棒翻转镇定:一种(Q)学习方法。 (英语) Zbl 1520.93434号 系统。控制信函。 176,文章ID 105527,8 p.(2023).MSC公司:93D21号 93D40型 93元29角 93B70型 92立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{Z.Liu}等人,系统。控制信函。176,文章ID 105527,8 p.(2023;Zbl 1520.93434) 全文: 内政部
亚历山大·罗奇 通过限价订单进行最优清算:一种神经网络和模拟方法。 (英语) Zbl 1518.91265号 Methodol公司。计算。申请。普罗巴伯。 25,第1号,第3号论文,29页(2023年).MSC公司:91G15型 93E20型 49升20 PDF格式BibTeX公司 XML格式引用 \textit{A.Roch},Methodol(麦道尔)。计算。申请。普罗巴伯。25,第1号,第3号论文,29页(2023年;Zbl 1518.91265) 全文: 内政部
安东尼·阿穆德瓦尔 一个随机收缩映射定理。 (英语) 兹比尔1519.93231 系统。控制信函。 174,文章ID 105482,第11页(2023).MSC公司:93E20型 93E24型 第93页第35页 PDF格式BibTeX公司 XML格式引用 \textit{A.Almudevar},系统。控制信函。174,文章ID 105482,11 p.(2023;Zbl 1519.93231) 全文: 内政部 arXiv公司
邢伟;赵旭东;塔梅尔·巴沙尔;夏伟国 能量收集两跳中继网络CPS远程状态估计的最优传输调度。 (英语) Zbl 1519.93218号 Automatica公司 152,文章ID 110963,12 p.(2023).MSC公司:93E10型 93B70型 93C83号 PDF格式BibTeX公司 XML格式引用 \textit{W.Xing}等人,Automatica 152,文章ID 110963,第12页(2023;Zbl 1519.93218) 全文: 内政部
王佳敏;刘健;郑元石;张栋 基于数据的\(\mathcal{五十} _2\)动态未知离散系统的增益最优控制。 (英语) 兹比尔1516.93047 J.富兰克林研究所。 360,第6号,4354-4377(2023).MSC公司:93B36型 93C55美元 93二氧化碳 93B52号 PDF格式BibTeX公司 XML格式引用 \textit{J.Wang}等人,J.Franklin Inst.360,No.6,4354-4377(2023;Zbl 1516.93047) 全文: 内政部
阿南德·巴拉克利什南;斯特凡·雅克西奇;埃德加·阿吉拉尔;德扬·尼科维奇;乔蒂莫·德斯穆赫 海报摘要:符号自动机编码目标的无模型强化学习。 (英语) Zbl 07807734号 第25届ACM混合系统国际会议论文集:计算和控制,HSCC 2022,CPS物联网周的一部分,意大利米兰和虚拟,2022年5月4日至6日。纽约州纽约市:计算机协会(ACM)。第26号论文,第2页(2022年)。MSC公司:65年第68季度 60年第68季度 93立方 PDF格式BibTeX公司 XML格式引用 \textit{A.Balakrishnan}等人,in:《第25届ACM混合系统国际会议论文集:计算与控制》,HSCC 2022,CPS-IoT周的一部分,意大利米兰,虚拟,2022年5月4-6日。纽约州纽约市:计算机协会(ACM)。第26号论文,第2页(2022;Zbl 07807734) 全文: 内政部
于新义;范月海;徐思玉;欧林林 一种基于强化学习的移动机器人自适应SAC-PID控制方法。 (英语) Zbl 1529.93063号 国际J鲁棒非线性控制 32,编号18,9625-9643(2022).MSC公司:93C40型 93B52号 93C85号 PDF格式BibTeX公司 XML格式引用 \textit{X.Yu}等,国际鲁棒非线性控制32,No.18,9625--9643(2022;Zbl 1529.93063) 全文: 内政部 arXiv公司
宣成斌;林浩强;施、钱;陈明 车辆轨迹跟踪任务的连续区间2型模糊Q学习算法。 (英语) Zbl 1528.93123号 国际J鲁棒非线性控制 32,编号8,4788-4815(2022).MSC公司:93立方厘米 93C85号 68T07型 PDF格式BibTeX公司 XML格式引用 \textit{C.Xuan}等人,《国际鲁棒非线性控制》32,No.8,4788--4815(2022;Zbl 1528.93123) 全文: 内政部 OA许可证
张,铁;吴才成;何英武;邹燕彪;廖彩蕾 基于深度强化学习的交叉耦合控制器增益参数优化策略。 (英语) Zbl 1523.93009号 工程优化。 54,第5期,727-742(2022).MSC公司:93C85号 90立方厘米 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{T.Zhang}等人,工程优化。54,编号5,727--742(2022;Zbl 1523.93009) 全文: 内政部
姚世轩;刘晓晨;张英辉;崔泽 通过在深度强化学习中引入细节反馈机制来解决非线性系统的最优控制问题。 (英语) Zbl 1509.49003号 数学。Biosci公司。工程师。 19,第9号,9258-9290(2022).MSC公司:49J20型 93立方厘米 35层21 PDF格式BibTeX公司 XML格式引用 \textit{S.Yao}等人,数学。Biosci公司。工程19,编号9,9258--9290(2022;Zbl 1509.49003) 全文: 内政部
菲根·奥岑;蒂克尔、狄利克·比尔金 机器人舞蹈建模方法。 (英语) Zbl 1504.93255号 石鹏(编辑)等,《复杂系统:跨越控制与计算控制论:应用》。在Georgi M.Dimirovski教授周年纪念日致辞。查姆:斯普林格。研究系统。Decis公司。控制415、35-58(2022)。MSC公司:93C85号 93元65角 PDF格式BibTeX公司 XML格式引用 \textit{F.Ùzen}和\textit{D.B.Turkel},研究系统。Decis公司。控制415,35-58(2022;Zbl 1504.93255) 全文: 内政部
陈再伟;张生;Doan,Thinh T。;约翰·鲍尔·克拉克;Siva Theja Maguluri 非线性随机逼近的有限样本分析及其在强化学习中的应用。 (英语) Zbl 1504.93364号 Automatica公司 146,文章ID 110623,第14页(2022).MSC公司:93E03型 93立方厘米 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{Z.Chen}等人,Automatica 146,文章ID 110623,14 p.(2022;Zbl 1504.93364) 全文: 内政部 arXiv公司
王伟;谢祥鹏;冯长阳 离散时间线性系统的无模型有限时域最优跟踪控制。 (英语) Zbl 1510.49032号 申请。数学。计算。 433,文章ID 127400,13 p.(2022).MSC公司:49纳米10 49公里21 93C55美元 PDF格式BibTeX公司 XML格式引用 \textit{W.Wang}等人,应用。数学。计算。433,文章ID 127400,13 p.(2022;Zbl 1510.49032) 全文: 内政部
巴贾里亚,普拉蒂克;阿莫尔·耶鲁德卡尔;路易吉·格里尔莫;卡门·德尔·维奇奥;吴宇虎 概率布尔控制网络的自触发控制:一种强化学习方法。 (英语) Zbl 07566311号 J.富兰克林研究所。 359,第12号,6173-6195(2022).MSC公司:93至XX 94-XX年 PDF格式BibTeX公司 XML格式引用 \textit{P.Bajaria}等人,J.Franklin Inst.359,No.12,6173--6195(2022;Zbl 07566311) 全文: 内政部
蒂鲍特·杰森 深度微分强化学习和最优交易。 (英语) Zbl 1497.91295号 数量。财务 22,第8期,1429-1443(2022).MSC公司:91G15型 68T07型 93E20型 PDF格式BibTeX公司 XML格式引用 \textit{T.Jaisson},数量。财务22,No.8,1429--1443(2022;Zbl 1497.91295) 全文: 内政部 arXiv公司
威廉姆斯·杰苏斯·洛佩斯·亚内斯;达斯·查加斯·德索萨,弗朗西斯科 利用自适应滤波算法通过Q学习研究探测噪声在最优控制LQR中的影响。 (英语) Zbl 1490.93130号 欧洲药典控制 65,文章ID 100633,12 p.(2022).MSC公司:93E20型 49纳米10 93C55美元 93二氧化碳 PDF格式BibTeX公司 XML格式引用 \textit{W.Jesús López Yánez}和\textit{F.das Chagas de Souza},欧洲期刊控制65,文章ID 100633,12 p.(2022;Zbl 1490.93130) 全文: 内政部
塞巴斯蒂安·贾姆加尔 强化学习和随机优化。 (英语) Zbl 1482.91225号 财务统计。 26,第1号,103-129(2022).MSC公司:91G80型 93E20型 68T07型 91A15型 PDF格式BibTeX公司 XML格式引用 \textit{S.Jaimungal},金融斯托克。26,编号103-129(2022年;兹bl 1482.91225) 全文: 内政部
雅库布穆西亚尔;克日什托夫·斯特贝尔;杰切克·切斯科特 一类动态过程的基于自改进Q学习的控制器。 (英语) Zbl 1495.93057号 架构(architecture)。控制科学。 31,3号,527-551(2021).MSC公司:93C85号 93C83号 PDF格式BibTeX公司 XML格式引用 \textit{J.Musial}等人,Arch。控制科学。31,编号3,527--551(2021;Zbl 1495.93057) 全文: 内政部
宁,布赖恩;林和婷;塞巴斯蒂安·贾姆加尔 双深度Q学习,实现最佳执行。 (英语) Zbl 1497.91299号 申请。数学。财务 28,第4期,361-380(2021年).MSC公司:91G15型 93E20型 68T07型 PDF格式BibTeX公司 XML格式引用 \textit{B.Ning}等人,应用。数学。财务28,No.4,361--380(2021;Zbl 1497.91299) 全文: 内政部 arXiv公司
恩斯特·莫里茨·哈恩;马特奥·佩雷斯;舍韦,斯文;法比奥·萨蒙齐;阿舒托什·特里维迪;多米尼克·沃伊特扎克 分枝马尔可夫决策过程的无模型强化学习。 (英语) Zbl 1493.93060号 Silva,Alexandra(编辑)等人,《计算机辅助验证》。第33届国际会议,CAV 2021,虚拟活动,2021年7月20日至23日。诉讼程序。第二部分。查姆:斯普林格。莱克特。注释计算。科学。12760, 651-673 (2021).MSC公司:第93页第35页 60J80型 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{E.M.Hahn}等人,Lect。注释计算。科学。12760、651--673(2021年;Zbl 1493.93060) 全文: 内政部 arXiv公司
刘军 关于强化学习与蒙特卡洛探索的收敛性。 (英语) Zbl 1478.93667号 Automatica公司 129,文章ID 109693,10 p.(2021).MSC公司:93E03型 68T05型 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{J.Liu},Automatica 129,文章ID 109693,10 p.(2021;Zbl 1478.93667) 全文: 内政部 arXiv公司
维维克·博卡尔。 收缩随机近似的浓度界。 (英语) Zbl 1475.93106号 系统。控制信函。 153,文章ID 104947,6 p.(2021); 更正同上,159,文章ID 105086,2 p.(2022)。MSC公司:93E03型 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{V.S.Borkar},系统。控制信函。153,文章ID 104947,第6页(2021;Zbl 1475.93106) 全文: 内政部
熊凯;魏春玲 基于Q学习的纯方位自主导航目标选择。 (英语) Zbl 1472.93044号 J.系统。科学。复杂。 34,第4期,1401-1425(2021).MSC公司:93B47码 93C85号 93E11号机组 93立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{K.Xiong}和\textit{C.Wei},J.系统。科学。复杂。34,第4号,1401-1425(2021;Zbl 1472.93044) 全文: 内政部
阿夫拉琴科夫,康斯坦丁·E。;维维克·博卡尔。;哈斯·多尔黑尔(Hars P.Dolhare)。;基绍尔·帕蒂尔 全梯度DQN强化学习:一种可证明收敛的方案。 (英语) Zbl 1471.93287号 Piunovskiy,Alexey(ed.)等人,《受控随机过程的现代趋势:理论与应用》,V.III.基于传统利物浦受控随机过程研讨会上的演讲的论文选集,英国利物浦,2021年7月。查姆:斯普林格。新兴复杂性。计算。41, 192-220 (2021).MSC公司:第93页第35页 90立方厘米 68T07型 PDF格式BibTeX公司 XML格式引用 \textit{K.E.Avrachenkov}等人,《新兴复合体》。计算。41192-220(2021年;Zbl 1471.93287) 全文: 内政部 arXiv公司 哈尔
孙耀威(Eric D.Sun)。;托马斯·C·T·迈克尔。;马哈德万,L。 复杂网络中老化的最优控制。 (英语) Zbl 1485.93030号 程序。国家。阿卡德。科学。美国 117,第34号,20405(2020).MSC公司:93甲14 49N90型 PDF格式BibTeX公司 XML格式引用 \textit{E.D.Sun}等人,Proc。国家。阿卡德。科学。美国117,第34号,20405(2020;Zbl 1485.93030) 全文: 内政部 arXiv公司
西蒙·戈茨查克;迈克尔·汉堡;马蒂亚斯·格德斯 一种用于深度强化学习的投影原-对偶梯度最优控制方法。 (英语) 兹比尔1472.49042 数学杂志。印度。 10,第9号论文,22页(2020年).MSC公司:49克15 90立方厘米 第93页第35页 60J20型 2006年第68季度 PDF格式BibTeX公司 XML格式引用 \textit{S.Gottschalk}等人,J.Math。Ind.10,论文编号9,22 p.(2020;Zbl 1472.49042) 全文: 内政部
弗洛里安·科普夫;西蒙·拉姆斯泰纳;卢卡·普切蒂;迈克尔·弗拉德;索伦·霍曼 时变参数轨迹无模型跟踪的自适应动态规划。 (英语) 兹比尔1469.93061 国际期刊改编。控制信号处理。 34,第7号,839-856(2020).MSC公司:93C40型 93C55美元 93B47码 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{F.Köpf}等人,国际期刊改编。控制信号处理。34,编号7,839--856(2020;Zbl 1469.93061) 全文: 内政部 arXiv公司
卢卡斯·贝肯巴赫;帕维尔·奥西连科;斯特里夫·斯特凡 一种保证稳定性的Q学习预测控制方案。 (英语) Zbl 1455.93049号 欧洲药典控制 56, 167-178 (2020).MSC公司:93B45码 93D20型 93C55美元 93立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{L.Beckenbach}等人,《欧洲期刊控制》56,167--178(2020;Zbl 1455.93049) 全文: 内政部
王伟;陈欣;傅浩;吴敏 基于Q-学习方法的部分可观测非零和对策的数据驱动自适应动态规划。 (英语) Zbl 1486.91022号 国际期刊系统。科学。,普林克。申请。系统。集成。 50,第7期,1338-1352(2019).MSC公司:91A50 93C55美元 90立方厘米 93B70型 PDF格式BibTeX公司 XML格式引用 \textit{W.Wang}等人,国际期刊系统。科学。,普林克。申请。系统。集成。50,编号7,1338--1352(2019;Zbl 1486.91022) 全文: 内政部
阮,Thanh;Mukhopadhyay、Snehasis;梅格纳·巴巴·塞本斯 为什么“自私的”优化代理可以解决分散强化学习问题。 (英语) Zbl 1467.93018号 AI通讯。 32,第2期,143-159(2019).MSC公司:93甲14 93甲16 93C40型 93二氧化碳 93立方厘米 93-08 PDF格式BibTeX公司 XML格式引用 \textit{T.Nguyen}等人,AI Commun。32,第2号,143--159(2019;Zbl 1467.93018) 全文: 内政部
赛义德·阿里·阿萨德·里兹维;林宗礼 离散时间线性系统最优输出跟踪控制的基于经验重放的输出反馈Q学习方案。 (英语) Zbl 1451.93203号 国际期刊改编。控制信号处理。 33,第12期,1825-1842(2019).MSC公司:93C40型 93B52号 93C55美元 93二氧化碳 PDF格式BibTeX公司 XML格式引用 \textit{S.A.A.Rizvi}和textit{Z.Lin},国际期刊Adapt。控制信号处理。33,第12号,1825-1842(2019;Zbl 1451.93203) 全文: 内政部
黄云涵;朱全燕 成本信号对抗操作下的欺骗性强化学习。 (英语) Zbl 1440.68215号 Alpcan,Tansu(编辑)等人,《安全决策与博弈论》。2019年10月30日至11月1日,第十届国际会议,2019年GameSec,瑞典斯德哥尔摩。诉讼程序。查姆:斯普林格。莱克特。注释计算。科学。11836, 217-237 (2019).MSC公司:68T05型 68平方米25 93C83号 PDF格式BibTeX公司 XML格式引用 \textit{Y.Huang}和\textit{Q.Zhu},Lect。注释计算。科学。11836,217--237(2019;Zbl 1440.68215) 全文: 内政部 arXiv公司
王斌;赵东斌;程,金 通过自适应动态编程和体验回放实现自适应巡航控制。 (英语) Zbl 1418.93129号 软计算。 23,第12号,4131-4144(2019).MSC公司:93C40型 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{B.Wang}等人,《软计算》。23,编号1214131-4144(2019;兹bl 1418.93129) 全文: 内政部
马丁·瓜伊;阿塔,哈立德·图基 一种基于集合的非线性系统无模型强化学习设计技术。 (英语) Zbl 1417.93138号 国际期刊改编。控制信号处理。 33,第2号,315-334(2019).MSC公司:93B52号 93立方厘米 49N90型 PDF格式BibTeX公司 XML格式引用 \textit{M.Guay}和\textit{K.T.Atta},国际期刊Adapt。控制信号处理。33,第2号,315--334(2019;Zbl 1417.93138) 全文: 内政部
李宇哲;雅利安·萨达特·梅尔;陈同文 用于通过基于SINR的通信信道进行远程估计的多传感器发射功率控制。 (英语) Zbl 1415.93252号 Automatica公司 101, 78-86 (2019).MSC公司:93E10型 93年1月15日 90立方厘米 91A15型 90B18号机组 PDF格式BibTeX公司 XML格式引用 \textit{Y.Li}等人,Automatica 101,78--86(2019;Zbl 1415.93252) 全文: 内政部
阮,Thanh;Mukhopadhyay、Snehasis 两阶段选择性分权,用MDP改进强化学习系统。 (英语) Zbl 1467.93017号 AI通讯。 31,第4号,319-337(2018).MSC公司:93甲14 93甲16 90立方厘米 93立方厘米 93二氧化碳 PDF格式BibTeX公司 XML格式引用 \textit{T.Nguyen}和\textit{S.Mukhopadhyay},AI Commun。31,第4号,319--337(2018;Zbl 1467.93017) 全文: 内政部
Daniel R.江。;沃伦·鲍威尔。 基于分位数风险度量的风险规避近似动态规划。 (英语) Zbl 1440.90084号 数学。操作。物件。 43,第2期,554-579(2018).MSC公司:90立方厘米 62L20型 91B06型 第93页第35页 PDF格式BibTeX公司 XML格式引用 \textit{D.R.Jiang}和\textit{W.B.Powell},数学。操作。第43号决议,第2号,554--579(2018;Zbl 1440.90084) 全文: 内政部 arXiv公司
赛义德·阿里·阿萨德·里兹维;林宗礼 离散时间线性零和对策的输出反馈Q学习及其在H_(infty)控制中的应用。 (英语) Zbl 1402.93126号 Automatica公司 95, 213-221 (2018).MSC公司:93B52号 93C55美元 93二氧化碳 93B36型 91A05型 68T05型 93立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{S.A.A.Rizvi}和\textit{Z.Lin},自动化95,213--221(2018;Zbl 1402.93126) 全文: 内政部
大卫·利奥托(David L.Leottau)。;哈维尔·鲁伊兹·德尔·索尔;罗伯特·巴布什卡 机器人行为的分散强化学习。 (英语) Zbl 1443.68188号 Artif公司。智力。 256, 130-159 (2018).MSC公司:68T40型 68T05型 68T42型 93甲16 PDF格式BibTeX公司 XML格式引用 \textit{D.L.Leottau}等人,Artif。智力。256、130-159(2018;Zbl 1443.68188) 全文: 内政部 链接
瓦姆武达基斯,Kyriakos G。;恩里克·费拉兹 具有最佳性能的连续线性系统的无模型事件触发控制算法。 (英语) Zbl 1378.93083号 Automatica公司 87, 412-420 (2018).MSC公司:93元65角 93B40码 93二氧化碳 93D20型 49N25号 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{K.G.Vamvoudakis}和\textit{H.Ferraz},Automatica 87,412--420(2018;Zbl 1378.93083) 全文: 内政部
拉杰什·库马尔;斯密蒂·斯利瓦斯塔瓦;J.R.P.古普塔。 基于Lyapunov稳定性的自适应动态规划非线性动力系统控制与辨识。 (英语) Zbl 1387.93081号 软计算。 21,第15号,4465-4480(2017).MSC公司:93立方厘米 93D05型 PDF格式BibTeX公司 XML格式引用 \textit{R.Kumar}等人,《软计算》。21,第15号,4465-4480(2017;Zbl 1387.93081) 全文: 内政部
米尔恰·博格丹;拉杜·埃米尔;罗马人、劳尔·克里斯蒂安 使用虚拟参考反馈调谐和强化Q学习改进无模型控制性能。 (英语) Zbl 1362.93062号 国际期刊系统。科学。,普林克。申请。系统。集成。 48,第5期,1071-1083(2017).MSC公司:93B52号 68T05型 93立方厘米 93C55美元 93立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{M.-B.Radac}等人,国际期刊系统。科学。,普林克。申请。系统。集成。48,第5号,1071--1083(2017;Zbl 1362.93062) 全文: 内政部
瓦姆武达基斯,Kyriakos G。 连续时间线性系统的Q学习:一种无模型无限时域最优控制方法。 (英语) Zbl 1356.93044号 系统。控制信函。 100, 14-20 (2017).MSC公司:93C40型 49立方米 93立方厘米 93C55美元 PDF格式BibTeX公司 XML格式引用 \textit{K.G.Vamvoudakis},系统。控制信函。100,14--20(2017;Zbl 1356.93044) 全文: 内政部
马蒂奥·盖塔;文森佐·洛亚;塞尔吉奥·米兰达;斯特凡妮亚·托马西耶洛 控制问题的函数网络拟合Q迭代。 (英语) Zbl 1483.68299号 申请。数学。建模 40,编号21-22,9183-9196(2016).MSC公司:68T05型 65季度30 93C40型 93C85号 PDF格式BibTeX公司 XML格式引用 \textit{M.Gaeta}等人,应用。数学。型号40,编号21--22,9183--9196(2016;Zbl 1483.68299) 全文: 内政部
Bhatnagar,沙拉布;拉克希曼南,K。 线性函数逼近的多尺度Q学习。 (英语) Zbl 1346.93265号 离散事件动态。系统。 第3期第26页,第477-509页(2016年).MSC公司:93C70号 93B40码 93E03型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{S.Bhatnagar}和\textit{K.Lakshmanan},离散事件动态。系统。26,第3号,477--509(2016;Zbl 1346.93265) 全文: 内政部
卞、陶;蒋忠平 数据驱动自适应最优控制设计的值迭代和自适应动态规划。 (英语) Zbl 1343.93095号 Automatica公司 71, 348-360 (2016).MSC公司:93E20型 93C40型 49升20 PDF格式BibTeX公司 XML格式引用 \textit{T.Bian}和\textit{Z.-P.Jiang},自动化71348-360(2016;兹bl 1343.93095) 全文: 内政部
威廉·B·哈斯克尔。;拉胡尔·贾恩;迪利普·卡拉提尔 经验动态规划。 (英语) Zbl 1338.49055号 数学。操作。物件。 41,第2期,402-429(2016).MSC公司:49升20 90立方厘米 93E20型 90立方厘米 60水25 62C12号机组 90立方厘米 65千5 47磅80 2005年3月37日 37小时99 PDF格式BibTeX公司 XML格式引用 \textit{W.B.Haskell}等人,《数学》。操作。第41号决议,第2402-429号(2016年;兹bl 1338.49055) 全文: 内政部 arXiv公司
费尔南德斯·古纳(Fernandez-Gauna,Borja);曼纽尔·格拉纳;何塞·曼纽尔·洛佩兹·古德;伊斯梅尔·埃特克塞贝里亚·阿吉里亚诺;伊戈尔·安索瓦特奎 强化学习具有安全否决权策略,用于学习链接多部件机器人系统的控制。 (英语) Zbl 1390.68691号 信息科学。 317, 25-47 (2015).MSC公司:68T40型 68T05型 93C85号 PDF格式BibTeX公司 XML格式引用 \textit{B.Fernandez-Gauna}等人,信息科学。317、25-47(2015;Zbl 1390.68691) 全文: 内政部
瓦姆武达基斯,Kyriakos G。 未知确定性连续线性系统的非零和Nash Q学习。 (英语) Zbl 1336.91022号 Automatica公司 61, 274-281 (2015).MSC公司:91A23型 91A06型 91A10号 68T05型 91A26型 93C40型 PDF格式BibTeX公司 XML格式引用 \textit{K.G.Vamvoudakis},自动化61,274--281(2015;Zbl 1336.91022) 全文: 内政部
刘德荣;严鹏飞;魏庆来 噪声环境下离散时间线性系统的基于数据的分析:可控性和可观性。 (英语) Zbl 1354.93025号 信息科学。 288, 314-329 (2014).MSC公司:93个B05 93个B07 93C55美元 93二氧化碳 93E10型 PDF格式BibTeX公司 XML格式引用 \textit{D.Liu}等人,《信息科学》。288,314-329(2014年;兹比尔1354.93025) 全文: 内政部
卞、陶;姜瑜;蒋忠平 非线性非仿射系统的自适应动态规划与最优控制。 (英语) Zbl 1301.49081号 Automatica公司 50,第10号,2624-2632(2014).MSC公司:49立方米 90立方厘米 93C40型 93D15号 PDF格式BibTeX公司 XML格式引用 \textit{T.Bian}等人,Automatica 50,No.10,2624--2632(2014;Zbl 1301.49081) 全文: 内政部
阿雷佐·凯沙瓦尔茨;斯蒂芬·博伊德 输入仿射系统的二次近似动态规划。 (英语) Zbl 1285.93103号 国际J鲁棒非线性控制 24,第3期,432-449(2014).MSC公司:93E20型 49升20 93E25型 90C25型 PDF格式BibTeX公司 XML格式引用 \textit{A.Keshavarz}和\textit{S.Boyd},《国际鲁棒非线性控制》24,第3期,432--449(2014;Zbl 1285.93103) 全文: 内政部
Bo Dong;李元春 基于ACI和Q函数的时变约束可重构模块化机器人分散强化学习鲁棒最优跟踪控制。 (英语) Zbl 1299.93184号 数学。问题。工程师。 2013年,文章ID 387817,16 p.(2013).MSC公司:93C85号 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{B.Dong}和\textit{Y.Li},数学。问题。Eng.2013,文章ID 387817,16 p.(2013;Zbl 1299.93184) 全文: 内政部
陈欣;陈刚;曹伟华;吴敏 多智能体系统的联合状态值逼近合作学习。 (英语) Zbl 1299.93001号 J.控制理论应用。 11,第2期,149-155(2013).MSC公司:93甲14 93C85号 68T05型 68T42型 PDF格式BibTeX公司 XML格式引用 \textit{X.Chen}等人,J.控制理论应用。11,No.2,149--155(2013;Zbl 1299.93001) 全文: 内政部
黄高兴;陈宇仁;姜伟成;林子凤 多agent协作中Q-学习的连续动作生成。 (英语) Zbl 1286.93016号 亚洲J.控制 15,第4期,1011-1020(2013).MSC公司:93甲14 68T42型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{K.-S.Hwang}et al.,Asian J.Control 15,No.4,1011--1020(2013;Zbl 1286.93016) 全文: 内政部
侯忠生;王卓 从基于模型的控制到数据驱动的控制:调查、分类和透视。 (英语) Zbl 1284.93010号 信息科学。 235,3-35(2013).MSC公司:93-02 93C40型 93立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{Z.-S.Hou}和\textit{Z.Wang},信息科学。235,3--35(2013;Zbl 1284.93010) 全文: 内政部
王、丁;刘德荣;魏庆来;赵东斌;金宁 基于自适应动态规划的未知非仿射非线性离散时间系统的最优控制。 (英语) Zbl 1269.49042号 Automatica公司 48,第8期,1825-1832(2012).MSC公司:49升20 90立方厘米 93C55美元 93立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{D.Wang}等人,《自动化48》,第8期,1825-1832(2012年;Zbl 1269.49042) 全文: 内政部 链接
贝克,C.L。;R·斯里坎特。 恒定步长(Q\)学习的误差界。 (英语) Zbl 1255.93129号 系统。控制信函。 61,第12期,1203-1208(2012).MSC公司:93E03型 68T05型 60J20型 PDF格式BibTeX公司 XML格式引用 \textit{C.L.Beck}和\textit{R.Srikant},系统。控制信函。61,第12号,1203-1208(2012;Zbl 1255.93129) 全文: 内政部
伦纳特·永;哈坎·哈勒马森;亨利克·奥尔森 四次遭遇系统识别。 (英语) 兹比尔1259.93044 欧洲药典控制 17,编号5-6,449-471(2011).MSC公司:93B30型 PDF格式BibTeX公司 XML格式引用 \textit{L.Ljung}等人,《欧洲期刊控制》17,No.5--6,449--471(2011;Zbl 1259.93044) 全文: 内政部 链接
拉提亚·马蒂农;纪尧姆·J·洛朗。;纳丁Le Fort-Piat;伊夫斯·安德雷·查普斯 通过强化学习设计分布式喷气MEMS微操作器的分散控制器。 (英语) Zbl 1203.93146号 J.智力。机器人。系统。 59,第2期,145-166(2010).MSC公司:93C85号 68T40型 PDF格式BibTeX公司 XML格式引用 \textit{L.Matignon}等人,J.Intell。机器人。系统。59,第2号,145--166(2010;Zbl 1203.93146) 全文: 内政部 哈尔
Pawe Wawrzyñski 通过连续演员评论家和经验回放进行实时强化学习。 (英语) Zbl 1396.68107号 神经网络。 22,第10期,1484-1497(2009).MSC公司:68T05型 93C40型 PDF格式BibTeX公司 XML格式引用 \textit{P.Wawrzyñski},神经网络。22,第10号,1484--1497(2009;Zbl 1396.68107) 全文: 内政部
安德烈亚·冈巴;泰瑟,马蒂奥 实物期权模型的结构估计。 (英语) Zbl 1170.91340号 《经济学杂志》。动态。控制 33,编号4,798-816(2009).MSC公司:91B24型 93E10型 60J20型 PDF格式BibTeX公司 XML格式引用 \textit{A.Gamba}和\textit{M.Tesser},J.Econ。动态。控制33,编号4,798--816(2009;Zbl 1170.91340) 全文: 内政部
安德烈亚·卡斯特莱蒂;弗朗西丝卡·皮亚诺西;Soncini-Sessa,鲁道夫 经济、社会和环境约束下的水库控制。 (英语) Zbl 1283.93250号 Automatica公司 44,第6期,1595-1607(2008).MSC公司:93E03型 92D40型 PDF格式BibTeX公司 XML格式引用 \textit{A.Castelletti}等人,Automatica 44,No.6,1595--1607(2008;Zbl 1283.93250) 全文: 内政部
Bhatnagar,沙拉布;K.Mohan先生Babu Q学习型的新算法。 (英语) Zbl 1283.93328号 Automatica公司 44,编号4,1111-1119(2008).MSC公司:第93页第35页 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{S.Bhatnagar}和\textit{K.M.Babu},Automatica 44,No.4,1111--1119(2008;Zbl 1283.93328) 全文: 内政部
安德烈亚·卡斯特莱蒂;弗朗西丝卡·皮亚诺西;Soncini-Sessa,鲁道夫 水资源规划和管理中的整合、参与和优化控制。 (英语) Zbl 1152.92025号 申请。数学。计算。 206,第1号,21-33(2008).MSC公司:92D40型 91B76号 93C20美元 68单位35 PDF格式BibTeX公司 XML格式引用 \textit{A.Castelletti}等人,应用。数学。计算。206,编号1,21-33(2008;Zbl 1152.92025) 全文: 内政部
杜大军;费敏瑞 使用actor-critic神经网络的两层网络学习控制系统。 (英语) Zbl 1162.93301号 申请。数学。计算。 205,编号1,26-36(2008).MSC公司:93A10号 93甲13 92B20型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{D.Du}和\textit{M.Fei},应用。数学。计算。205,编号1,26-36(2008;Zbl 1162.93301) 全文: 内政部
Kaygisiz,Burak H。;伊斯梅特·埃尔克曼;艾丹·埃尔克曼(Aydan M.Erkmen)。 双腿机器人行走规律中混沌粗糙度的智能分析。 (英语) Zbl 1147.93372号 混沌孤子分形 29,第1期,148-161(2006).MSC公司:93C85号 93B30型 37D45号 37号35 PDF格式BibTeX公司 XML格式引用 \textit{B.H.Kaygisiz}等人,混沌孤子分形29,No.1,148--161(2006;Zbl 1147.93372) 全文: 内政部
李钟民;Lee,Jay H。 非线性过程输入输出数据驱动控制的近似动态规划方法。 (英语) Zbl 1092.93011号 Automatica公司 41,第7期,1281-1288(2005).MSC公司:93B30型 90立方厘米 49升20 93C55美元 PDF格式BibTeX公司 XML格式引用 \textit{J.M.Lee}和\textit{J.H.Lee},自动化41,第7期,1281--1288(2005;Zbl 1092.93011) 全文: 内政部
曹锡仁 马尔可夫系统基于事件优化的基本思想。 (英语) Zbl 1130.90054号 离散事件动态。系统。 15,第2期,169-197(2005).MSC公司:90立方厘米 60J10型 60J20型 93元65角 PDF格式BibTeX公司 XML格式引用 \textit{X.Cao},离散事件动态。系统。15,第2169--197号(2005年;兹bl 1130.90054) 全文: 内政部
曹锡仁;任志远;Bhatnagar,沙拉布;迈克尔·傅;史蒂文·马库斯 马尔可夫决策过程的时间聚合方法。 (英语) Zbl 1026.93054号 Automatica公司 38,第6期,929-943(2002). 审核人:H.Pragarauskas(维尔纽斯) MSC公司:93E20型 90立方厘米 93C55美元 93E10型 PDF格式BibTeX公司 XML格式引用 \textit{X.Cao}等人,Automatica 38,No.6,929--943(2002;Zbl 1026.93054) 全文: 内政部
曾宪义;周建德;克里斯蒂安·瓦瑟尔 使用学习自动机控制非线性系统的策略。 (英语) Zbl 0959.93511号 Automatica公司 36,第10期,1517-1524(2000).MSC公司:93立方厘米 93C40型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{X.Zeng}等人,Automatica 36,No.10,1517--1524(2000;Zbl 0959.93511) 全文: 内政部
安德烈·博纳里尼;菲利波·巴索 学习为自治代理组合模糊行为。 (英语) 兹伯利0941.68672 国际J近似推理 17,第4号,409-432(1997).MSC公司:68T05型 68周05 93立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{A.Bonarini}和\textit{F.Basso},《国际近似推理》17,第4期,409--432(1997;Zbl 0941.68672) 全文: 内政部
S.Sathiya Keerthi;拉文德兰,B。 强化学习的辅导调查。 (英语) 兹比尔1026.93520 萨达纳 19,第6号,851-889(1994). 审核人:安德鲁·戴尔(德班) MSC公司:第93页第35页 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{S.S.Keerthi}和\textit{B.Ravindran},萨达纳19,第6号,851--889(1994;Zbl 1026.93520) 全文: 内政部
罗纳德·莫勒。;沃伊切赫·J·科洛德齐耶(Wojciech J.Kolodziej)。 一类非线性随机系统的最优控制。 (英语) Zbl 0474.93075号 IEEE传输。自动。控制 26, 1048-1053 (1981).MSC公司:93E20型 93立方厘米 93E11号机组 49J55型 60 H10型 34F05型 PDF格式BibTeX公司 XML格式引用 \textit{R.R.Mohler}和\textit{W.J.Kolodziej},IEEE Trans。自动。控制26,1048--1053(1981;Zbl 0474.93075) 全文: 内政部