克里希南德·查特吉;雷蒙多·索纳;布鲁诺·齐利奥托 具有长期平均目标的POMDP中的有限记忆策略。 (英语) Zbl 1492.90189号 数学。操作。物件。 47,第1号,100-119(2022).MSC公司:90立方厘米 90立方厘米 37A50型 2015年3月1日 PDF格式BibTeX公司 XML格式引用 \textit{K.Chatterjee}等人,《数学》。操作。第47号决议,第1号,100--119(2022年;Zbl 1492.90189) 全文: 内政部 arXiv公司 链接
于慧珍;迪米特里·贝尔塞卡斯(Dimitri P.Bertsekas)。 关于平均成本POMDP有限状态控制器集的近似最优性。 (英语) Zbl 1159.93364号 数学。操作。物件。 33,第1期,第1-11页(2008年).MSC公司:93E20型 93C55美元 90立方厘米 93立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{H.Yu}和\textit{D.P.Bertsekas},数学。操作。第33号决议,第1-11号(2008年;兹bl 1159.93364) 全文: 内政部
伊曼纽尔·米尔曼 随机博弈的半代数理论。 (英语) Zbl 1082.91507号 数学。操作。物件。 27,编号2401-418(2002).MSC公司:91A15型 93C40型 第14页99 PDF格式BibTeX公司 XML格式引用 \textit{E.Milman},数学。操作。第27号决议,第2号,401-418(2002年;Zbl 1082.91507) 全文: 内政部