文档搜索结果-zbMATH Open

×

找到84个文档（结果1-84）

最新引文相关性

王健;王伟;梁晓峰;左、赵

离散时间线性系统的有限维跟踪控制。（英语） Zbl 07821078号

国际J鲁棒非线性控制 34，编号1，54-70（2024）.

MSC公司：93B36型 93C55美元 93二氧化碳

PDF格式 BibTeX公司 XML格式引用

全文：内政部

阿莫尔·耶鲁德卡尔;伊万格洛斯·查查鲁拉斯;卡门·德尔·维奇奥;索蒂里斯·莫斯科伊安尼斯

概率布尔控制网络的采样数据控制：深度强化学习方法。（英语） Zbl 07834414号

信息科学。 619, 374-389 (2023).

MSC公司：93元57 93元29角 93B70型 93E03型 90立方厘米 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

尼古拉斯·萨基;吉安·保罗·因切雷莫纳;安东尼拉·费拉拉

本质冗余机械臂的基于滑动模式的故障诊断和深度强化学习插件。（英语） Zbl 07816531号

国际J鲁棒非线性控制 33，第15号，9109-9127（2023）.

MSC公司：93磅12英寸 93C85号 68T07型 93B52号 93B18号机组

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

勒内·卡莫纳;马修·劳里埃;谭宗军

无模型平均场强化学习：平均场MDP和平均场Q学习。（英语） Zbl 07791537号

附录申请。普罗巴伯。 33，编号6B，5334-5381（2023）.

MSC公司：65个M12 65M99型 93E20型 93E25型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

黄，Runnan;秦成轩;李建玲;兰、雪晶

基于报酬修正深度Q网络的移动机器人在未知动态连续环境中的路径规划。（英语） Zbl 1531.93308号

最佳方案。控制应用程序。方法 44，编号3，1570-1587（2023）.

MSC公司：93C85号 68T42型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

朱晓霞;袁欣;鲁东;王远大;孙昌银

离散时间多智能体系统基于邻域Q学习的一致性控制。（英语） Zbl 1531.93396号

最佳方案。控制应用程序。方法 44，第3期，1475-1490（2023）.

MSC公司：93D50型 93C55美元 93甲16

PDF格式 BibTeX公司 XML格式引用

全文：内政部

李强;徐云君

基于降维的自适应动态规划用于离散非线性控制仿射系统的最优控制。（英语） Zbl 1526.93121号

国际J.控制 96，第11号，2799-2811（2023）.

MSC公司：93C40型 49升20 93C55美元 93立方厘米 93D20型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

Michiaki Takizawa;小林，小一;Yuh Yamashita

使用强化学习设计概率布尔网络的降阶和固定控制器。（英语） Zbl 07736230号

申请。数学。计算。 457，文章ID 128211，9 p.（2023）.

MSC公司：93亿 93立方厘米 94Cxx号

PDF格式 BibTeX公司 XML格式引用

全文：内政部

巴伊拉克塔尔，埃尔罕;阿里·德夫兰·卡拉

受控扩散过程的近似Q学习及其近似最优性。（英语） Zbl 1521.93214号

SIAM J.数学。数据科学。 5，第3号，615-638（2023）.

MSC公司：第93页第35页 90立方厘米 93E20型 60J60型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

安托万·莱斯根·兰德里;Duncan S·Callaway。

近似多智能体拟合Q迭代。（英语） Zbl 1520.93019号

系统。控制信函。 177，文章ID 105563，10 p.（2023）.

MSC公司：93甲16 93E03型 90立方厘米 90立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

刘泽娇;刘，杨;阮启华;桂伟华

布尔网络的鲁棒翻转镇定：一种（Q）学习方法。（英语） Zbl 1520.93434号

系统。控制信函。 176，文章ID 105527，8 p.（2023）.

MSC公司：93D21号 93D40型 93元29角 93B70型 92立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部

亚历山大·罗奇

通过限价订单进行最优清算：一种神经网络和模拟方法。（英语） Zbl 1518.91265号

Methodol公司。计算。申请。普罗巴伯。 25，第1号，第3号论文，29页（2023年）.

MSC公司：91G15型 93E20型 49升20

PDF格式 BibTeX公司 XML格式引用

全文：内政部

安东尼·阿穆德瓦尔

一个随机收缩映射定理。（英语）兹比尔1519.93231

系统。控制信函。 174，文章ID 105482，第11页（2023）.

MSC公司：93E20型 93E24型第93页第35页

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

邢伟;赵旭东;塔梅尔·巴沙尔;夏伟国

能量收集两跳中继网络CPS远程状态估计的最优传输调度。（英语） Zbl 1519.93218号

Automatica公司 152，文章ID 110963，12 p.（2023）.

MSC公司：93E10型 93B70型 93C83号

PDF格式 BibTeX公司 XML格式引用

全文：内政部

王佳敏;刘健;郑元石;张栋

基于数据的\（\mathcal{五十} _2\)动态未知离散系统的增益最优控制。（英语）兹比尔1516.93047

J.富兰克林研究所。 360，第6号，4354-4377（2023）.

MSC公司：93B36型 93C55美元 93二氧化碳 93B52号

PDF格式 BibTeX公司 XML格式引用

全文：内政部

阿南德·巴拉克利什南;斯特凡·雅克西奇;埃德加·阿吉拉尔;德扬·尼科维奇;乔蒂莫·德斯穆赫

海报摘要：符号自动机编码目标的无模型强化学习。（英语） Zbl 07807734号

第25届ACM混合系统国际会议论文集：计算和控制，HSCC 2022，CPS物联网周的一部分，意大利米兰和虚拟，2022年5月4日至6日。纽约州纽约市：计算机协会（ACM）。第26号论文，第2页（2022年）。

MSC公司：65年第68季度 60年第68季度 93立方

PDF格式 BibTeX公司 XML格式引用

全文：内政部

于新义;范月海;徐思玉;欧林林

一种基于强化学习的移动机器人自适应SAC-PID控制方法。（英语） Zbl 1529.93063号

国际J鲁棒非线性控制 32，编号18，9625-9643（2022）.

MSC公司：93C40型 93B52号 93C85号

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

宣成斌;林浩强;施、钱;陈明

车辆轨迹跟踪任务的连续区间2型模糊Q学习算法。（英语） Zbl 1528.93123号

国际J鲁棒非线性控制 32，编号8，4788-4815（2022）.

MSC公司：93立方厘米 93C85号 68T07型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

张，铁;吴才成;何英武;邹燕彪;廖彩蕾

基于深度强化学习的交叉耦合控制器增益参数优化策略。（英语） Zbl 1523.93009号

工程优化。 54，第5期，727-742（2022）.

MSC公司：93C85号 90立方厘米 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

姚世轩;刘晓晨;张英辉;崔泽

通过在深度强化学习中引入细节反馈机制来解决非线性系统的最优控制问题。（英语） Zbl 1509.49003号

数学。Biosci公司。工程师。 19，第9号，9258-9290（2022）.

MSC公司：49J20型 93立方厘米 35层21

PDF格式 BibTeX公司 XML格式引用

全文：内政部

菲根·奥岑;蒂克尔、狄利克·比尔金

机器人舞蹈建模方法。（英语） Zbl 1504.93255号

石鹏（编辑）等，《复杂系统：跨越控制与计算控制论：应用》。在Georgi M.Dimirovski教授周年纪念日致辞。查姆：斯普林格。研究系统。Decis公司。控制415、35-58（2022）。

MSC公司：93C85号 93元65角

PDF格式 BibTeX公司 XML格式引用

全文：内政部

陈再伟;张生;Doan，Thinh T。;约翰·鲍尔·克拉克;Siva Theja Maguluri

非线性随机逼近的有限样本分析及其在强化学习中的应用。（英语） Zbl 1504.93364号

Automatica公司 146，文章ID 110623，第14页（2022）.

MSC公司：93E03型 93立方厘米 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

王伟;谢祥鹏;冯长阳

离散时间线性系统的无模型有限时域最优跟踪控制。（英语） Zbl 1510.49032号

申请。数学。计算。 433，文章ID 127400，13 p.（2022）.

MSC公司：49纳米10 49公里21 93C55美元

PDF格式 BibTeX公司 XML格式引用

全文：内政部

巴贾里亚，普拉蒂克;阿莫尔·耶鲁德卡尔;路易吉·格里尔莫;卡门·德尔·维奇奥;吴宇虎

概率布尔控制网络的自触发控制：一种强化学习方法。（英语） Zbl 07566311号

J.富兰克林研究所。 359，第12号，6173-6195（2022）.

MSC公司：93至XX 94-XX年

PDF格式 BibTeX公司 XML格式引用

全文：内政部

蒂鲍特·杰森

深度微分强化学习和最优交易。（英语） Zbl 1497.91295号

数量。财务 22，第8期，1429-1443（2022）.

MSC公司：91G15型 68T07型 93E20型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

威廉姆斯·杰苏斯·洛佩斯·亚内斯;达斯·查加斯·德索萨，弗朗西斯科

利用自适应滤波算法通过Q学习研究探测噪声在最优控制LQR中的影响。（英语） Zbl 1490.93130号

欧洲药典控制 65，文章ID 100633，12 p.（2022）.

MSC公司：93E20型 49纳米10 93C55美元 93二氧化碳

PDF格式 BibTeX公司 XML格式引用

全文：内政部

塞巴斯蒂安·贾姆加尔

强化学习和随机优化。（英语） Zbl 1482.91225号

财务统计。 26，第1号，103-129（2022）.

MSC公司：91G80型 93E20型 68T07型 91A15型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

雅库布穆西亚尔;克日什托夫·斯特贝尔;杰切克·切斯科特

一类动态过程的基于自改进Q学习的控制器。（英语） Zbl 1495.93057号

架构（architecture）。控制科学。 31,3号，527-551（2021）.

MSC公司：93C85号 93C83号

PDF格式 BibTeX公司 XML格式引用

全文：内政部

宁，布赖恩;林和婷;塞巴斯蒂安·贾姆加尔

双深度Q学习，实现最佳执行。（英语） Zbl 1497.91299号

申请。数学。财务 28，第4期，361-380（2021年）.

MSC公司：91G15型 93E20型 68T07型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

恩斯特·莫里茨·哈恩;马特奥·佩雷斯;舍韦，斯文;法比奥·萨蒙齐;阿舒托什·特里维迪;多米尼克·沃伊特扎克

分枝马尔可夫决策过程的无模型强化学习。（英语） Zbl 1493.93060号

Silva，Alexandra（编辑）等人，《计算机辅助验证》。第33届国际会议，CAV 2021，虚拟活动，2021年7月20日至23日。诉讼程序。第二部分。查姆：斯普林格。莱克特。注释计算。科学。12760, 651-673 (2021).

MSC公司：第93页第35页 60J80型 90立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

关于强化学习与蒙特卡洛探索的收敛性。（英语） Zbl 1478.93667号

Automatica公司 129，文章ID 109693，10 p.（2021）.

MSC公司：93E03型 68T05型 90立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

维维克·博卡尔。

收缩随机近似的浓度界。（英语） Zbl 1475.93106号

系统。控制信函。 153，文章ID 104947，6 p.（2021）; 更正同上，159，文章ID 105086，2 p.（2022）。

MSC公司：93E03型 90立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部

熊凯;魏春玲

基于Q学习的纯方位自主导航目标选择。（英语） Zbl 1472.93044号

J.系统。科学。复杂。 34，第4期，1401-1425（2021）.

MSC公司：93B47码 93C85号 93E11号机组 93立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部

阿夫拉琴科夫，康斯坦丁·E。;维维克·博卡尔。;哈斯·多尔黑尔（Hars P.Dolhare）。;基绍尔·帕蒂尔

全梯度DQN强化学习：一种可证明收敛的方案。（英语） Zbl 1471.93287号

Piunovskiy，Alexey（ed.）等人，《受控随机过程的现代趋势：理论与应用》，V.III.基于传统利物浦受控随机过程研讨会上的演讲的论文选集，英国利物浦，2021年7月。查姆：斯普林格。新兴复杂性。计算。41, 192-220 (2021).

MSC公司：第93页第35页 90立方厘米 68T07型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司哈尔

孙耀威（Eric D.Sun）。;托马斯·C·T·迈克尔。;马哈德万，L。

复杂网络中老化的最优控制。（英语） Zbl 1485.93030号

程序。国家。阿卡德。科学。美国 117，第34号，20405（2020）.

MSC公司：93甲14 49N90型

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

西蒙·戈茨查克;迈克尔·汉堡;马蒂亚斯·格德斯

一种用于深度强化学习的投影原-对偶梯度最优控制方法。（英语）兹比尔1472.49042

数学杂志。印度。 10，第9号论文，22页（2020年）.

MSC公司：49克15 90立方厘米第93页第35页 60J20型 2006年第68季度

PDF格式 BibTeX公司 XML格式引用

全文：内政部

弗洛里安·科普夫;西蒙·拉姆斯泰纳;卢卡·普切蒂;迈克尔·弗拉德;索伦·霍曼

时变参数轨迹无模型跟踪的自适应动态规划。（英语）兹比尔1469.93061

国际期刊改编。控制信号处理。 34，第7号，839-856（2020）.

MSC公司：93C40型 93C55美元 93B47码 90立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

卢卡斯·贝肯巴赫;帕维尔·奥西连科;斯特里夫·斯特凡

一种保证稳定性的Q学习预测控制方案。（英语） Zbl 1455.93049号

欧洲药典控制 56, 167-178 (2020).

MSC公司：93B45码 93D20型 93C55美元 93立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部

王伟;陈欣;傅浩;吴敏

基于Q-学习方法的部分可观测非零和对策的数据驱动自适应动态规划。（英语） Zbl 1486.91022号

国际期刊系统。科学。，普林克。申请。系统。集成。 50，第7期，1338-1352（2019）.

MSC公司：91A50 93C55美元 90立方厘米 93B70型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

阮，Thanh;Mukhopadhyay、Snehasis;梅格纳·巴巴·塞本斯

为什么“自私的”优化代理可以解决分散强化学习问题。（英语） Zbl 1467.93018号

AI通讯。 32，第2期，143-159（2019）.

MSC公司：93甲14 93甲16 93C40型 93二氧化碳 93立方厘米 93-08

PDF格式 BibTeX公司 XML格式引用

全文：内政部

赛义德·阿里·阿萨德·里兹维;林宗礼

离散时间线性系统最优输出跟踪控制的基于经验重放的输出反馈Q学习方案。（英语） Zbl 1451.93203号

国际期刊改编。控制信号处理。 33，第12期，1825-1842（2019）.

MSC公司：93C40型 93B52号 93C55美元 93二氧化碳

PDF格式 BibTeX公司 XML格式引用

全文：内政部

黄云涵;朱全燕

成本信号对抗操作下的欺骗性强化学习。（英语） Zbl 1440.68215号

Alpcan，Tansu（编辑）等人，《安全决策与博弈论》。2019年10月30日至11月1日，第十届国际会议，2019年GameSec，瑞典斯德哥尔摩。诉讼程序。查姆：斯普林格。莱克特。注释计算。科学。11836, 217-237 (2019).

MSC公司：68T05型 68平方米25 93C83号

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

王斌;赵东斌;程，金

通过自适应动态编程和体验回放实现自适应巡航控制。（英语） Zbl 1418.93129号

软计算。 23，第12号，4131-4144（2019）.

MSC公司：93C40型 90立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部

马丁·瓜伊;阿塔，哈立德·图基

一种基于集合的非线性系统无模型强化学习设计技术。（英语） Zbl 1417.93138号

国际期刊改编。控制信号处理。 33，第2号，315-334（2019）.

MSC公司：93B52号 93立方厘米 49N90型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

李宇哲;雅利安·萨达特·梅尔;陈同文

用于通过基于SINR的通信信道进行远程估计的多传感器发射功率控制。（英语） Zbl 1415.93252号

Automatica公司 101, 78-86 (2019).

MSC公司：93E10型 93年1月15日 90立方厘米 91A15型 90B18号机组

PDF格式 BibTeX公司 XML格式引用

全文：内政部

阮，Thanh;Mukhopadhyay、Snehasis

两阶段选择性分权，用MDP改进强化学习系统。（英语） Zbl 1467.93017号

AI通讯。 31，第4号，319-337（2018）.

MSC公司：93甲14 93甲16 90立方厘米 93立方厘米 93二氧化碳

PDF格式 BibTeX公司 XML格式引用

全文：内政部

Daniel R.江。;沃伦·鲍威尔。

基于分位数风险度量的风险规避近似动态规划。（英语） Zbl 1440.90084号

数学。操作。物件。 43，第2期，554-579（2018）.

MSC公司：90立方厘米 62L20型 91B06型第93页第35页

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

赛义德·阿里·阿萨德·里兹维;林宗礼

离散时间线性零和对策的输出反馈Q学习及其在H_（infty）控制中的应用。（英语） Zbl 1402.93126号

Automatica公司 95, 213-221 (2018).

MSC公司：93B52号 93C55美元 93二氧化碳 93B36型 91A05型 68T05型 93立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部

大卫·利奥托（David L.Leottau）。;哈维尔·鲁伊兹·德尔·索尔;罗伯特·巴布什卡

机器人行为的分散强化学习。（英语） Zbl 1443.68188号

Artif公司。智力。 256, 130-159 (2018).

MSC公司：68T40型 68T05型 68T42型 93甲16

PDF格式 BibTeX公司 XML格式引用

全文：内政部链接

瓦姆武达基斯，Kyriakos G。;恩里克·费拉兹

具有最佳性能的连续线性系统的无模型事件触发控制算法。（英语） Zbl 1378.93083号

Automatica公司 87, 412-420 (2018).

MSC公司：93元65角 93B40码 93二氧化碳 93D20型 49N25号 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

拉杰什·库马尔;斯密蒂·斯利瓦斯塔瓦;J.R.P.古普塔。

基于Lyapunov稳定性的自适应动态规划非线性动力系统控制与辨识。（英语） Zbl 1387.93081号

软计算。 21，第15号，4465-4480（2017）.

MSC公司：93立方厘米 93D05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

米尔恰·博格丹;拉杜·埃米尔;罗马人、劳尔·克里斯蒂安

使用虚拟参考反馈调谐和强化Q学习改进无模型控制性能。（英语） Zbl 1362.93062号

国际期刊系统。科学。，普林克。申请。系统。集成。 48，第5期，1071-1083（2017）.

MSC公司：93B52号 68T05型 93立方厘米 93C55美元 93立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部

瓦姆武达基斯，Kyriakos G。

连续时间线性系统的Q学习：一种无模型无限时域最优控制方法。（英语） Zbl 1356.93044号

系统。控制信函。 100, 14-20 (2017).

MSC公司：93C40型 49立方米 93立方厘米 93C55美元

PDF格式 BibTeX公司 XML格式引用

全文：内政部

马蒂奥·盖塔;文森佐·洛亚;塞尔吉奥·米兰达;斯特凡妮亚·托马西耶洛

控制问题的函数网络拟合Q迭代。（英语） Zbl 1483.68299号

申请。数学。建模 40，编号21-22，9183-9196（2016）.

MSC公司：68T05型 65季度30 93C40型 93C85号

PDF格式 BibTeX公司 XML格式引用

全文：内政部

Bhatnagar，沙拉布;拉克希曼南，K。

线性函数逼近的多尺度Q学习。（英语） Zbl 1346.93265号

离散事件动态。系统。第3期第26页，第477-509页（2016年）.

MSC公司：93C70号 93B40码 93E03型 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

卞、陶;蒋忠平

数据驱动自适应最优控制设计的值迭代和自适应动态规划。（英语） Zbl 1343.93095号

Automatica公司 71, 348-360 (2016).

MSC公司：93E20型 93C40型 49升20

PDF格式 BibTeX公司 XML格式引用

全文：内政部

威廉·B·哈斯克尔。;拉胡尔·贾恩;迪利普·卡拉提尔

经验动态规划。（英语） Zbl 1338.49055号

数学。操作。物件。 41，第2期，402-429（2016）.

MSC公司：49升20 90立方厘米 93E20型 90立方厘米 60水25 62C12号机组 90立方厘米 65千5 47磅80 2005年3月37日 37小时99

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

费尔南德斯·古纳（Fernandez-Gauna，Borja）;曼纽尔·格拉纳;何塞·曼纽尔·洛佩兹·古德;伊斯梅尔·埃特克塞贝里亚·阿吉里亚诺;伊戈尔·安索瓦特奎

强化学习具有安全否决权策略，用于学习链接多部件机器人系统的控制。（英语） Zbl 1390.68691号

信息科学。 317, 25-47 (2015).

MSC公司：68T40型 68T05型 93C85号

PDF格式 BibTeX公司 XML格式引用

全文：内政部

瓦姆武达基斯，Kyriakos G。

未知确定性连续线性系统的非零和Nash Q学习。（英语） Zbl 1336.91022号

Automatica公司 61, 274-281 (2015).

MSC公司：91A23型 91A06型 91A10号 68T05型 91A26型 93C40型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

刘德荣;严鹏飞;魏庆来

噪声环境下离散时间线性系统的基于数据的分析：可控性和可观性。（英语） Zbl 1354.93025号

信息科学。 288, 314-329 (2014).

MSC公司：93个B05 93个B07 93C55美元 93二氧化碳 93E10型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

卞、陶;姜瑜;蒋忠平

非线性非仿射系统的自适应动态规划与最优控制。（英语） Zbl 1301.49081号

Automatica公司 50，第10号，2624-2632（2014）.

MSC公司：49立方米 90立方厘米 93C40型 93D15号

PDF格式 BibTeX公司 XML格式引用

全文：内政部

阿雷佐·凯沙瓦尔茨;斯蒂芬·博伊德

输入仿射系统的二次近似动态规划。（英语） Zbl 1285.93103号

国际J鲁棒非线性控制 24，第3期，432-449（2014）.

MSC公司：93E20型 49升20 93E25型 90C25型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

Bo Dong;李元春

基于ACI和Q函数的时变约束可重构模块化机器人分散强化学习鲁棒最优跟踪控制。（英语） Zbl 1299.93184号

数学。问题。工程师。 2013年，文章ID 387817，16 p.（2013）.

MSC公司：93C85号 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

陈欣;陈刚;曹伟华;吴敏

多智能体系统的联合状态值逼近合作学习。（英语） Zbl 1299.93001号

J.控制理论应用。 11，第2期，149-155（2013）.

MSC公司：93甲14 93C85号 68T05型 68T42型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

黄高兴;陈宇仁;姜伟成;林子凤

多agent协作中Q-学习的连续动作生成。（英语） Zbl 1286.93016号

亚洲J.控制 15，第4期，1011-1020（2013）.

MSC公司：93甲14 68T42型 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

侯忠生;王卓

从基于模型的控制到数据驱动的控制：调查、分类和透视。（英语） Zbl 1284.93010号

信息科学。 235，3-35（2013）.

MSC公司：93-02 93C40型 93立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部

王、丁;刘德荣;魏庆来;赵东斌;金宁

基于自适应动态规划的未知非仿射非线性离散时间系统的最优控制。（英语） Zbl 1269.49042号

Automatica公司 48，第8期，1825-1832（2012）.

MSC公司：49升20 90立方厘米 93C55美元 93立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部链接

贝克，C.L。;R·斯里坎特。

恒定步长（Q\）学习的误差界。（英语） Zbl 1255.93129号

系统。控制信函。 61，第12期，1203-1208（2012）.

MSC公司：93E03型 68T05型 60J20型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

伦纳特·永;哈坎·哈勒马森;亨利克·奥尔森

四次遭遇系统识别。（英语）兹比尔1259.93044

欧洲药典控制 17，编号5-6，449-471（2011）.

MSC公司：93B30型

PDF格式 BibTeX公司 XML格式引用

全文：内政部链接

拉提亚·马蒂农;纪尧姆·J·洛朗。;纳丁Le Fort-Piat;伊夫斯·安德雷·查普斯

通过强化学习设计分布式喷气MEMS微操作器的分散控制器。（英语） Zbl 1203.93146号

J.智力。机器人。系统。 59，第2期，145-166（2010）.

MSC公司：93C85号 68T40型

PDF格式 BibTeX公司 XML格式引用

全文：内政部哈尔

Pawe Wawrzyñski

通过连续演员评论家和经验回放进行实时强化学习。（英语） Zbl 1396.68107号

神经网络。 22，第10期，1484-1497（2009）.

MSC公司：68T05型 93C40型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

安德烈亚·冈巴;泰瑟，马蒂奥

实物期权模型的结构估计。（英语） Zbl 1170.91340号

《经济学杂志》。动态。控制 33，编号4，798-816（2009）.

MSC公司：91B24型 93E10型 60J20型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

安德烈亚·卡斯特莱蒂;弗朗西丝卡·皮亚诺西;Soncini-Sessa，鲁道夫

经济、社会和环境约束下的水库控制。（英语） Zbl 1283.93250号

Automatica公司 44，第6期，1595-1607（2008）.

MSC公司：93E03型 92D40型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

Bhatnagar，沙拉布;K.Mohan先生Babu

Q学习型的新算法。（英语） Zbl 1283.93328号

Automatica公司 44，编号4，1111-1119（2008）.

MSC公司：第93页第35页 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

安德烈亚·卡斯特莱蒂;弗朗西丝卡·皮亚诺西;Soncini-Sessa，鲁道夫

水资源规划和管理中的整合、参与和优化控制。（英语） Zbl 1152.92025号

申请。数学。计算。 206，第1号，21-33（2008）.

MSC公司：92D40型 91B76号 93C20美元 68单位35

PDF格式 BibTeX公司 XML格式引用

全文：内政部

杜大军;费敏瑞

使用actor-critic神经网络的两层网络学习控制系统。（英语） Zbl 1162.93301号

申请。数学。计算。 205，编号1，26-36（2008）.

MSC公司：93A10号 93甲13 92B20型 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

Kaygisiz，Burak H。;伊斯梅特·埃尔克曼;艾丹·埃尔克曼（Aydan M.Erkmen）。

双腿机器人行走规律中混沌粗糙度的智能分析。（英语） Zbl 1147.93372号

混沌孤子分形 29，第1期，148-161（2006）.

MSC公司：93C85号 93B30型 37D45号 37号35

PDF格式 BibTeX公司 XML格式引用

全文：内政部

李钟民;Lee，Jay H。

非线性过程输入输出数据驱动控制的近似动态规划方法。（英语） Zbl 1092.93011号

Automatica公司 41，第7期，1281-1288（2005）.

MSC公司：93B30型 90立方厘米 49升20 93C55美元

PDF格式 BibTeX公司 XML格式引用

全文：内政部

马尔可夫系统基于事件优化的基本思想。（英语） Zbl 1130.90054号

离散事件动态。系统。 15，第2期，169-197（2005）.

MSC公司：90立方厘米 60J10型 60J20型 93元65角

PDF格式 BibTeX公司 XML格式引用

全文：内政部

曹锡仁;任志远;Bhatnagar，沙拉布;迈克尔·傅;史蒂文·马库斯

马尔可夫决策过程的时间聚合方法。（英语） Zbl 1026.93054号

Automatica公司 38，第6期，929-943（2002）.

审核人：H.Pragarauskas（维尔纽斯）

MSC公司：93E20型 90立方厘米 93C55美元 93E10型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

曾宪义;周建德;克里斯蒂安·瓦瑟尔

使用学习自动机控制非线性系统的策略。（英语） Zbl 0959.93511号

Automatica公司 36，第10期，1517-1524（2000）.

MSC公司：93立方厘米 93C40型 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

安德烈·博纳里尼;菲利波·巴索

学习为自治代理组合模糊行为。（英语）兹伯利0941.68672

国际J近似推理 17，第4号，409-432（1997）.

MSC公司：68T05型 68周05 93立方厘米

PDF格式 BibTeX公司 XML格式引用

全文：内政部

S.Sathiya Keerthi;拉文德兰，B。

强化学习的辅导调查。（英语）兹比尔1026.93520

萨达纳 19，第6号，851-889（1994）.

审核人：安德鲁·戴尔（德班）

MSC公司：第93页第35页 68T05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

罗纳德·莫勒。;沃伊切赫·J·科洛德齐耶（Wojciech J.Kolodziej）。

一类非线性随机系统的最优控制。（英语） Zbl 0474.93075号

IEEE传输。自动。控制 26, 1048-1053 (1981).

MSC公司：93E20型 93立方厘米 93E11号机组 49J55型 60 H10型 34F05型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

筛选结果依据…

文档类型

期刊文章(79)
收藏品(5)

全部的前5名

作者

全部的前5名

序列号

全部的前5名

出版年份

2024(1)
2023(14)
2022（12）
2021(7)
2020（4）
2019(7)
2018(5)
2017(3)
2016（4）
2015(2)
2014(3)
2013（4）
2012(2)
2011(1)
2010(1)
2009(2)
2008（4）
2006(1)
2005(2)
2002(1)
2000(1)
1997(1)
1994(1)
1981(1)

全部的前3名

主字段

全部的前3名

软件

© 2024FIZ卡尔斯鲁厄股份有限公司隐私政策法律声明条款和条件