{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2022,4,4],“日期-时间”:“2022-04-04T05:14:17Z”,“时间戳”:1649049257048},“参考-计数”:24,“出版商”:“Springer Science and Business Media LLC”,“问题”:“2”,“许可证”:[{“开始”:{-“日期-零件”:[[2015,12,16]],“日期时间”:“2015-12-16T00:00:00Z”,“timestamp”:1450224000000},“content-version”:“tdm”,“delay-in-days”:0,“URL”:“http://www.springer.com/tdm”}],“content-domain”:{“domain”:[“link.springer.com”],“crossmark-restriction”:false},”short-container-title“:[”Math Meth Oper Res“],”published-print“:{”date-parts“:[2016,4]]},‘DOI’:“10.1007\/s00186-015-0524-y“,”类型“:”日志文章“,“创建”:{“date-parts”:[[2015,12,15]],“date-time”:“2015-12-15T22:52:06Z”,“时间戳”:1450219926000},“page”:“161-177”,“更新策略”:“http://\/dx.doi.org\/10.1007\/springer_crossmark_policy”,“源”:“Crossref”、“is-referenced-by-count”:7,“标题”:[“关于具有吸收状态的未贴现半马尔可夫决策过程”],“前缀”:“10.1007”,“”:“83”,“author”:[{“given”:“Prasenjit”,“family”:“Mondal”,“sequence”:“first”,“affiliation”:[]}],“member”:“297”,“published online”:{“date parts”:[〔2015,12,16〕]},“reference”:[{“issue”:“04”,“key”:“524_CR1”,“doi asserted by”:“crossref”,“first page”:“635”,“doi”:“10.1017\/S026964807000003X”,“volume”:“21”,“作者”:“M Baykal Gursoy”,“年份”:“2007”,“非结构化”:“Baykal-Gursoy M,Gursoy K(2007)Semi-Markov决策过程。Prob-Eng-Inform Sci 21(04):635\u2013657”,“journal-title”:“Prob-Eng Inform Scy”},{“key”:“524_CR2”,“doi-asserted-by”:“crossref”,“first-page”:“719”,“doi”:“10.1214\/aoms\/117704593”,“volument”:“33”,“author”:“D Blackwell”,“year”:“1962”,“非结构化”:“Blackwell D(1962)离散动态规划。Ann Math Stat 33:719\u2013726“,”journal-title“:”Ann Math Stat“},{”issue“:”1“,”key“:”524_CR3“,”doi-asserted-by“:”crossref“,”first page“:“25”,”doi“:”10.1016\/j.ress.2004.11.001“,“volume”:“90”,“author”:“D Chen”,“year”:“2005”,“unstructured”:“Chen D,Trivedi KS(2005)基于半马尔可夫决策过程的状态维修优化。Reliab Eng Syst Saf 90(1):25\u201329”,“期刊标题”:“Reliab Eng Syst Saf”},{“issue”:“4”,“key”:“524_CR4”,“doi断言”:“crossref”,“首页”:“560”,“doi”:“10.1287\/mnsc.45.4.560”,“volume”:“45”,“author”:“TK Das”,“year”:“1999”,“nonstructured”:“Das TK,Gosavi A,Mahadevan S,Marchaleck N(1999)使用平均报酬强化学习解决半马尔可夫决策问题。Manage Sci 45(4):560\u2013574“,”journal-title“:”Manage Scy“},{”issue“:”1“,”key“:”524_CR5“,”doi-asserted-by“:”crossref“,”first page“:“16”,“doi”:“10.1287\/mnsc.9.1.16”,“volume”:“9”,“author”:“C Derman”,“year”:“1962”,“unstructured”:“Derman C(1962)On sequential decisions and Markov chains.Manage Sci9(1):16\u2013.24“,”新闻标题“:”管理科学“},{“issue“:”1“,”key“:”524_CR6“,”doi-asserted-by“:”crossref“,”first-page“:”276“,“doi”:“10.1214\/aoms\/1177699618”,“volume”:“37”,“author”:“C Derman”,“year”:“1966”,“unstructured”:“Derman C,Strauch RE(1966)关于控制顺序控制过程的无记忆规则的注释。Ann Math Stat 37(1):276\u2013278“,“journal-title”:“Ann Math Stat”},{“key”:“524_CR7”,“unstructured”:“Everett H(1957)递归游戏。In:Dresher M,Tucker AW,Wolfe P(eds)对游戏理论III的贡献,Ann.Math.Studies 39。普林斯顿大学出版社,普林斯顿,pp 47\u201378“},{“key”:“524_CR8”,“doi-asserted-by”:“crossref”,“first page”:”842“,”doi“:”10.2307\/3213439“,”volume“:”15“,”author“:”A Federgruen“,”year“:”1978“unstructured”:”Federgrue A,Hordijk A,Tijms HC(1978)关于可数随机矩阵集上同时递归条件的注记。J Appl Prob 15:842\u2013847“,”journal-title“:”J Appl Prob“},{”issue“:”3“,”key“:”524_CR9“,”doi-asserted-by“:”crossref“,”first page“:“257”,”doi“:”10.1007“/BF01435458“,”volume“:”39“,”author“:”EA Feinberg“,”year“:”1994“,”unstructured“:”Feinberg-EA(1994)Constrained Semi-Markov decision process with average rewards.Math Methods Op er研究39(3):257\u2013288“,”journal-title“:”Math Methods Oper Res“},{”issue“:”4“,”key“:”524_CR10“,”doi-asserted-by“:”crossref“,”first-page“:”1016“,”doi“:”10.1287\/moor.21.4.1016“,“volume”:“21”,“author”:“J Flesch”,“year”:“1996”,“unstructured”:“Flesch J,Thuijsman F,Vrieze OJ(1996)带吸收状态的递归重复游戏。数学运算研究21(4):1016\u20131022“,”journal-title“:”Math Operat Res“},{”issue“:”6“,”key“:”524_CR11“,”doi-asserted-by“:”crossref“,”first page“:“2109”,”doi“:”10.1137\/S0363012902411027“,”volume“::”43“,”author“:”K Hinderer“,”year“:”2005“,”unstructured“:”Hinderer K,Waldmann KH(2005)具有吸收集的可数状态马尔可夫决策模型的算法。SIAM J Contr Optim 43(6):2109\u20132131“,”journal-title“:”SIAM J Contrr Optim“},{“key”:“524_CR12”,“unstructured”:“Howard RA(1963)Semi-Markovian decision process.Proceedings of international statistical institute,Ottawa,Canada”},“key“:”524_CR13“,“doi-asserted-by”:“crossref”,“first-pages”:“938”,“doi”:“10.1287\/opere.11.6.938”“,”volume“:“2”,”author“:”WS-Jewell“,”year“:”1963“,”unstructured“:”Jewell WS(1963)Markov-reneval programming I and II。Operat Res 2:938\u2013971“,”journal-title“:”Operat Res“},{”issue“:”2“,”key“:”524_CR14“,”doi-asserted-by“:”crossref“,”first page“:“339”,“doi”:“10.1287\/moor.1030.0077”,“volume”:“29”,“author”:“L Jianyong”,“year”:“2004”,“unstructured”:“Jianyon L,Xiaobo Z(2004)”一般多链结构的平均报酬半马尔可夫决策过程。数学运算研究29(2):339\u2013352“,”日记标题“:”数学运算研究“},{“key”:“524_CR15”,“volume-title”:“有限马尔可夫链”,“author”:“JG Kemeny”,“year”:“1976”,“unstructured”:“Kemeny JG,Snell JL(1976)有限马尔可夫链。Van Nostrand,New York”},},”key“:“524-CR16”,“doi-asserted-by”:“crossref”,“非结构化”:“库恩·HW(1953)广泛的游戏和信息问题。在Kuhn HW,Tucker AW(ed)对博弈理论的贡献。第二卷,安。数学。Stud.28,193\u2013216,普林斯顿大学出版社,“DOI”:“10.1515\/9781400881970-012”},{“key”:“524_CR17”,“DOI-asserted-by”:“crossref”,“unstructured”:“Mondal P(2015)线性规划与零和两人未贴现半马尔可夫博弈。亚太地区运筹学杂志32(5):1550043”,“DOI:”10.1142\/S021759591550438 8英寸doi-asserted-by“:”crossref“,”first page“:”1540022-1“,“doi”:“10.1142 \/S0219198915400228”,“volume”:“17”,“author”:“P Mondal”,“year”:“2015”,“unstructured”:“Mondal P,Sinha S(2015)当一个玩家控制转移概率和转移时间时半马尔可夫博弈的有序场性质。国际博弈论Rev 17(2):1540022-1\u20131540022-26“,“journal-title”:“国际博弈论评论”},{“key”:“524_CR19”,“volume-title“:“应用概率模型与优化应用”,“author”:“SM Ross”,“year”:“1970”,“unstructured”:“Ross SM(1970)应用概率模型和优化应用。Holden-Day,San Francisco”}、{“issue”:“2”,“key“:”524_CR20“,”doi-asserted-by“:”crossref“,”first-page“:”470“,”doi“:”10.1287\/moor.17.2.470“,”volume“:“17”,”author“:”M Schal“,”year“:”1992“,”unstructured“:”Schal M(1992)关于半马尔可夫决策模型的第二个最优性方程。数学歌剧研究17(2):470\u2013486“,”杂志标题“:”数学歌剧研究“},{”问题“:”4“,”关键“:”524_CR21“,”doi-asserted-by“:”crossref“,”首页“:”308“,”doi“:”10.1287\/moor.3.4.308“、”卷“:”3“,”作者“:”PJ Schweitzer“,“年份”:“1978”,“非结构化”:“Schweitser PJ,Federgruen A(1978))未折现马尔可夫更新规划的函数方程。数学运算研究3(4):308\u2013321“,”日记标题“:”数学运算研究“},{”问题“:”02“,”关键字“:”524_CR22“,”doi-asserted-by“:”crossref“,”first page“:”247“,”doi“:”10.1017\/S026964800001121“,“volume”:“3”,“author”:“LI Sennott”,“year”:“1989”,“unstructured”:“Sennott LI(1989)平均费用半马尔可夫决策过程与排队系统的控制。Probab Eng Inf Sci 3(02):247\u2013272“,“journal-title”:“Probab Eng Inf Sci”},{“key”:“524_CR23”,“unstructured”:“Weyl H(1950)von Neumann的极小极大定理的初等证明。In:Kuhn HW,Tucker AW(eds)对博弈论的贡献,第一卷,数学研究,第24卷。普林斯顿大学出版社,新泽西州普林斯顿,第19\u201325页“},{“问题”:“11”,“关键”:“524_CR24”,“doi-asserted-by”:“crossref”,“首页”:“1073”,“doi”:“10.1057\/jors.1993.181”,“卷”:“44”,“作者”:“DJ White”,“年份”:“1993”,“非结构化”:“White DJ(1993)马尔可夫决策过程应用调查。J Operat Res Soc 44(11):1073\u20131096”,“journal-title“:”J Operat Res Soc“}],“container-title”:[“运筹学的数学方法”],“原始标题”:[],“语言”:“en”,“链接”:[{“URL”:“http://\/link.springer.com/content\/pdf\/10007\/s00186-015-0524-y.pdf”,“内容类型”:“应用程序\/pdf”、“内容版本”:“vor”,“intended-application”:“text-mining”},{“URL”:“http://\/link.springer.com/article\/10.1007\/s00186-015-0524-y\/fulltext.html“,”content-type“:”text\/html“,”content-version“:”vor“,”intended-application“:”text-mining“},{”URL“:”http://\-link.springer.com\/content\/pdf\/10007\/s00186-015-0524-y“,”内容类型“:”unspecified“,”content-version y-检查“}],”存放“:{“date-parts”:[[2019,5,23]],“date-time”:“2019-05-23T10:33:33Z”,“timestamp”:1558607613000},“score”:1,“resource”:{主“URL”:“http://\link.sprimary.com\/10.1007\/s00186-015-0524-y”}},”副标题“:[],”短标题“:[],“issued”:{“date-ports”:[2015,12,16]]},,“references-count”:24,“新闻发布”:{“发布”:“2”,“发布-发布”:日期部分“:[[2016,4]}},”alternative-id“:[”524“],”URL“:”http://\/dx.doi.org\/10.1007\/s00186-015-0524-y“,”关系“:{},“ISSN”:[“1432-2994”,“1432-5217”],“ISSN-type”:[{“value”:“1432-2996”,“type”:“print”},{“value”:”1432-527“,”type“:”电子“}],“subject”:[],“已发布”:{“日期部分”:[[2015,12,16]]}}