安托万·莱斯根·兰德里;邓肯·S·卡拉威。 近似多智能体拟合Q迭代。 (英语) 兹比尔1520.93019 系统。控制信函。 177,文章ID 105563,10 p.(2023).MSC公司:93甲16 93E03型 90立方厘米 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{A.Lesage-Landry}和\textit{D.S.Callaway},系统。控制信函。177,文章ID 105563,10 p.(2023;Zbl 1520.93019) 全文: DOI程序 arXiv公司
刘泽娇;刘,杨;阮其华;桂伟华 布尔网络的鲁棒翻转镇定:一种(Q)学习方法。 (英语) Zbl 1520.93434号 系统。控制信函。 176,文章ID 105527,8 p.(2023).MSC公司:93D21号 93D40型 93元29角 93磅70 第92页第42页 PDF格式BibTeX公司 XML格式引用 \textit{Z.Liu}等人,系统。控制信函。176,文章ID 105527,8 p.(2023;Zbl 1520.93434) 全文: DOI程序
安东尼·阿穆德瓦尔 一个随机收缩映射定理。 (英语) Zbl 1519.93231号 系统。控制信函。 174,文章ID 105482,第11页(2023).MSC公司:93E20型 93E24型 93E35型 PDF格式BibTeX公司 XML格式引用 \textit{A.Almudevar},系统。控制信函。174,文章ID 105482,11 p.(2023;Zbl 1519.93231) 全文: DOI程序 arXiv公司
西德哈特·昌达克;维维克·博卡尔。;多尔黑尔,哈什 为\(\operatorname{LSPE}(\lambda)\)绑定的浓度。 (英语) 兹比尔1505.93252 系统。控制信函。 171,文章ID 105418,第9页(2023).MSC公司:93E03型 PDF格式BibTeX公司 XML格式引用 \textit{S.Chandak}等人,系统。控制信函。171,文章ID 105418,9 p.(2023;Zbl 1505.93252) 全文: DOI程序 arXiv公司
维维克·博卡尔。;西德哈特·昌达克 前瞻性理论Q学习。 (英语) Zbl 07423717号 系统。控制信函。 156,文章ID 105009,10 p.(2021).MSC公司:68泰克 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{V.S.Borkar}和\textit{S.Chandak},系统。控制信函。156,文章ID 105009,10 p.(2021;Zbl 07423717) 全文: DOI程序 arXiv公司
尼提亚·维贾扬;洛杉矶Prashanth。 用于非策略强化学习的基于平滑函数的梯度算法:非渐近观点。 (英语) Zbl 07423703号 系统。控制信函。 155,文章ID 104988,11 p.(2021).MSC公司:68泰克 PDF格式BibTeX公司 XML格式引用 \textit{N.Vijayan}和\textit{L.A.Prashanth},系统。控制信函。155,文章ID 104988,11 p.(2021;Zbl 07423703) 全文: DOI程序 arXiv公司
维维克·博卡尔。 收缩随机近似的浓度界。 (英语) Zbl 1475.93106号 系统。控制信函。 153,文章ID 104947,6 p.(2021); 更正同上,159,文章ID 105086,第2页(2022)。MSC公司:93E03型 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{V.S.Borkar},系统。控制信函。153,文章ID 104947,6 p.(2021;Zbl 1475.93106) 全文: DOI程序
A.卡雷。;M.C.坎皮。;塞吉,B.C。;E.韦耶。 符号扰动系统辨识中面临建模不足问题。 (英语) Zbl 1475.93033号 系统。控制信函。 153,文章ID 104936,10 p.(2021).MSC公司:93B30型 93二氧化碳 PDF格式BibTeX公司 XML格式引用 \textit{A.Carè}等人,系统。控制信函。153,文章ID 104936,10 p.(2021;Zbl 1475.93033) 全文: DOI程序
瑞安·默里;米歇尔·帕拉迪诺 强化学习中的系统不确定性模型。 (英语) Zbl 1408.93078号 系统。控制信函。 122, 24-31 (2018).MSC公司:93立方厘米 93C40型 93E03型 90立方厘米 68T05型 49公里15 PDF格式BibTeX公司 XML格式引用 \textit{R.Murray}和\textit{M.Palladino},系统。控制信函。122、24-31(2018;Zbl 1408.93078) 全文: DOI程序 arXiv公司
瓦姆武达基斯,Kyriakos G。 连续时间线性系统的Q学习:一种无模型无限时域最优控制方法。 (英语) Zbl 1356.93044号 系统。控制信函。 100,14-20(2017).MSC公司:93C40型 49立方米 93立方厘米 93C55 PDF格式BibTeX公司 XML格式引用 \textit{K.G.Vamvoudakis},系统。控制信函。100,14--20(2017;Zbl 1356.93044) 全文: DOI程序
Cheng,Daizhan(代战);齐洪生;刘婷;王远华 布尔控制网络可观测性的注记。 (英语) Zbl 1327.93094号 系统。控制信函。 87, 76-82 (2016).MSC公司:93英镑 93立方 94立方厘米10 PDF格式BibTeX公司 XML格式引用 \textit{D.Cheng}等人,系统。控制信函。87、76-82(2016年;Zbl 1327.93094) 全文: DOI程序
D.马特拉西。;因诺琴蒂,G。;贾雷,L。;马里兰州萨拉帕卡。 作为压缩感知的网络模型识别。 (英语) Zbl 1279.93019号 系统。控制信函。 62,第8期,664-672(2013).MSC公司:93A30型 93E03型 93E12号机组 PDF格式BibTeX公司 XML格式引用 \textit{D.Materassi}等人,系统。控制信函。62,第8号,664--672(2013;Zbl 1279.93019) 全文: DOI程序 arXiv公司
贝克,C.L。;R·斯里坎特。 恒定步长\(Q\)-学习的误差边界。 (英语) 兹比尔1255.93129 系统。控制信函。 第61203-1208号第61页(2012年).MSC公司:93E03型 68T05型 60年20日 PDF格式BibTeX公司 XML格式引用 \textit{C.L.Beck}和\textit{R.Srikant},系统。控制信函。61,第12号,1203-1208(2012;Zbl 1255.93129) 全文: DOI程序
萨米尔·卡马尔 步长自适应随机逼近的稳定性。 (英语) Zbl 1250.93128号 系统。控制信函。 61,第4期,543-548(2012).MSC公司:93E25型 93E15型 60 H10型 PDF格式BibTeX公司 XML格式引用 \textit{S.Kamal},系统。控制信函。61,第4号,543--548(2012;Zbl 1250.93128) 全文: DOI程序 arXiv公司
阿比吉特·戈萨维 (Q\)学习中迭代的有界性。 (英语) Zbl 1129.93552号 系统。控制信函。 55,第4期,347-349(2006).MSC公司:93E35型 90立方厘米 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{A.Gosavi},系统。控制信函。55,第4号,347--349(2006;Zbl 1129.93552) 全文: DOI程序
爱德华多·桑塔格。 连续时间递归神经网络的学习结果。 (英语) Zbl 0909.93011号 系统。控制信函。 34,第3期,151-158(1998).MSC公司:93B30型 92B20型 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{E.D.桑塔格},系统。控制信函。34,第3号,151--158(1998;Zbl 0909.93011) 全文: DOI程序
彼得·巴特利特。;桑吉夫·库尔卡尼。 模型类的复杂性和平滑噪声数据。 (英语) Zbl 0909.93076号 系统。控制信函。 34,第3期,133-140(1998年).MSC公司:93埃14 93E10型 PDF格式BibTeX公司 XML格式引用 \textit{P.L.Bartlett}和\textit{S.R.Kulkarni},系统。控制信函。34,第3号,133--140(1998;Zbl 0909.93076) 全文: DOI程序
维迪亚萨加,M。 介绍PAC学习理论的一些统计方面。 (英语) Zbl 0909.93083号 系统。控制信函。 34,第3期,115-124(1998).MSC公司:93E35型 93-02 PDF格式BibTeX公司 XML格式引用 \textit{M.Vidyasagar},系统。控制信函。34,第3号,115--124(1998;Zbl 0909.93083) 全文: DOI程序
维维克·博卡尔。 具有两个时间尺度的随机近似。 (英语) Zbl 0895.62085号 系统。控制信函。 29,第5期,291-294(1997).MSC公司:62L20型 93C70号 PDF格式BibTeX公司 XML格式引用 \文本{V.S.Borkar},系统。控制信函。29,第52991-294号(1997年;Zbl 0895.62085) 全文: DOI程序