J.Abounadi。;D.伯塞卡斯。;博卡尔,V.S。 具有平均成本的马尔可夫决策过程的学习算法。 (英语) Zbl 1001.93091号 SIAM J.控制优化 40,第3期,681-698(2001). 审核人:吴成勋(上海) MSC公司:93年20日 90立方厘米 62L20型 93E15型 49升20 PDF格式BibTeX公司 XML格式引用 \textit{J.Abounadi}等人,SIAM J.控制优化。40,编号3681-698(2001年;兹bl 1001.93091) 全文: 内政部
安吉莉亚·奈迪奇;迪米特里·贝尔塞卡斯 增量次梯度算法的收敛速度。 (英语) Zbl 0984.90033号 Uryasev、Stanislav(编辑)等人,《随机优化:算法和应用》。会议,佛罗里达大学,佛罗里达州塔拉哈西,美国,2000年2月20日至22日。多德雷赫特:Kluwer学术出版社。申请。最佳方案。54, 223-264 (2001).MSC公司:90C25型 52A41型 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{A.Nedić}和\textit{D.Bertsekas},应用。最佳方案。54、223--264(2001;Zbl 0984.90033)