黎静;熊俊林 线性指数二次高斯问题的强化学习。 (英语) 兹伯利07850436 系统。控制信函。 185,文章ID 105749,10 p.(2024).MSC公司:93E03型 49甲10 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{J.Lai}和\textit{J.Xiong},系统。控制信函。185,文章ID 105749,10 p.(2024;Zbl 07850436) 全文: 内政部
范文武;熊俊林 未知随机参数线性系统LQR控制的值迭代。 (英语) Zbl 07850425号 系统。控制信函。 185,文章ID 105731,7 p.(2024).MSC公司:93E20型 49甲10 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{W.Fan}和\textit{J.Xiong},系统。控制信函。185,文章ID 105731,7 p.(2024;Zbl 07850425) 全文: 内政部
安东尼·阿穆德瓦尔 一个随机收缩映射定理。 (英语) Zbl 1519.93231号 系统。控制信函。 174,文章ID 105482,第11页(2023).MSC公司:93E20型 93E24型 93E35型 PDF格式BibTeX公司 XML格式引用 \textit{A.Almudevar},系统。控制信函。174,文章ID 105482,第11页(2023;Zbl 1519.93231) 全文: 内政部 arXiv公司
普拉森吉特·卡马卡;沙拉布·巴特纳加 风险敏感强化学习中函数逼近误差的紧界。 (英语) Zbl 1478.91064号 系统。控制信函。 150,文章ID 104899,7 p.(2021).MSC公司:91B06型 93E20型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{P.Karmakar}和\textit{S.Bhatnagar},系统。控制信函。150,文章ID 104899,7 p.(2021;Zbl 1478.91064) 全文: 内政部
哈,明明;王、丁;刘德荣 折扣最优控制的广义值迭代及稳定性分析。 (英语) Zbl 1454.93226号 系统。控制信函。 147,文章ID 104847,8 p.(2021).MSC公司:93D20型 93C55美元 93立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{M.Ha}等人,系统。控制信函。147,文章ID 104847,8 p.(2021;Zbl 1454.93226) 全文: 内政部
瓦姆武达基斯,Kyriakos G。 连续时间线性系统的Q学习:一种无模型无限时域最优控制方法。 (英语) Zbl 1356.93044号 系统。控制信函。 100, 14-20 (2017).MSC公司:93C40型 49立方米 93立方厘米 93C55美元 PDF格式BibTeX公司 XML格式引用 \textit{K.G.Vamvoudakis},系统。控制信函。100,14--20(2017;Zbl 1356.93044) 全文: 内政部
杨世平;徐建新;黄德清;谭莹 多智能体系统一致性跟踪的最优迭代学习控制设计。 (英语) Zbl 1288.93011号 系统。控制信函。 69, 80-89 (2014).MSC公司:93甲14 68T05型 68T42型 93立方厘米 93B60型 PDF格式BibTeX公司 XML格式引用 \textit{S.Yang}等人,系统。控制信函。69、80-89(2014;Zbl 1288.93011) 全文: 内政部
藤本贤治;佐藤,佐藤 基于变分对称性的哈密顿系统的重复控制。 (英语) Zbl 1229.49036号 系统。控制信函。 60,第9期,763-770(2011).MSC公司:49N20型 68T05型 93年第35季度 PDF格式BibTeX公司 XML格式引用 \textit{K.Fujimoto}和\textit{S.Satoh},系统。控制信函。60,第9号,763--770(2011;Zbl 1229.49036) 全文: 内政部 链接
博卡尔,V.S。 马尔可夫链自校正的样本复杂度。 (英语) Zbl 0985.93061号 系统。控制信函。 41,第2期,95-104(2000).MSC公司:93E35型 93E20型 60J22型 PDF格式BibTeX公司 XML格式引用 \textit{V.S.Borkar},系统。控制信函。41,第2号,95--104(2000;Zbl 0985.93061) 全文: 内政部
迪马西,G.B。;斯特特纳。 具有长期平均成本的离散马尔可夫过程的贝叶斯自适应控制。 (英语) 兹比尔0902.93071 系统。控制信函。 34,编号1-2,55-62(1998).MSC公司:93E35型 93C40型 93C55美元 93E20型 PDF格式BibTeX公司 XML格式引用 \textit{G.B.Di Masi}和\textit{Ł.Stettner},系统。控制信函。34,编号1--2,55-62(1998;Zbl 0902.93071) 全文: 内政部
高,A.J。;巴西克·杜肯,B。 连续时间一阶系统的随机线性二次自适应控制。 (英语) 兹比尔0901.93076 系统。控制信函。 31,第3期,149-154(1997).MSC公司:93E35型 93E20型 93E24型 PDF格式BibTeX公司 XML格式引用 \textit{A.J.Gao}和\textit{B.Pasik-Duncan},系统。控制信函。31,第3号,149--154(1997;Zbl 0901.93076) 全文: 内政部