维克托·佩斯蒂恩;王小波 具有马尔可夫充分性的有限阶段报酬函数。 (英语) Zbl 0777.90078号 随机过程应用。 46,第1期,129-151(1993). 审核人:D.J.怀特(曼彻斯特) MSC公司:90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{V.Pestien}和\textit{X.Wang},随机过程应用。46,第1号,129--151(1993;Zbl 0777.90078) 全文: 内政部
尤金·范伯格(Eugene A.Feinberg)。 随机决策过程中的非随机策略。 (英语) Zbl 0717.90092号 安·Oper。物件。 29,编号1-4,315-332(1991).MSC公司:90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{E.A.Feinberg},Ann.Oper。第29号决议,编号1--4,315--332(1991;Zbl 0717.90092) 全文: 内政部
西奥多·希尔。;Victor C.佩斯蒂恩。 一般收益决策过程的良好马尔可夫策略的存在性。 (英语) 兹比尔0627.90094 随机过程应用。 24, 61-76 (1987). 审核人:G.Hübner先生 MSC公司:90立方厘米 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{T.P.Hill}和\textit{V.C.Pestien},随机过程应用。24、61-76(1987年;Zbl 0627.90094) 全文: 内政部 链接
van Nunen,J.A.E。;韦塞尔斯,J。 关于具有总报酬准则的马尔可夫决策问题的理论和算法。 (英语) Zbl 0443.90108号 OR演讲 1, 57-67 (1979).MSC公司:90立方厘米 90-02 65千5 60 K15 PDF格式BibTeX公司 XML格式引用 \textit{J.A.E.E.van Nunen}和textit{J.Wessels},OR Spektrum 1,57--67(1979;Zbl 0443.90108) 全文: 内政部
van Hee,K.M。;韦塞尔斯,J。 马尔可夫决策过程和强过量函数。 (英语) Zbl 0386.90062号 随机过程应用。 8, 59-76 (1978).MSC公司:90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{K.M.van Hee}和\textit{J.Wessels},随机过程应用。8、59-76(1978年;Zbl 0386.90062) 全文: 内政部