{“状态”:“好”,“消息类型”:“工作”,“消息版本”:“1.0.0”,“消息”:{“索引”:{“日期部分”:[[2022,4,3]],“日期时间”:“2022-04-03T14:19:51Z”,“时间戳”:16489955591969},“引用计数”:13,“出版商”:“世界科学出版社私人有限公司”,“问题”:“03”,“内容域”:{“域”:[],“交叉标记限制”:false},“短容器标题”:[“Int.J。工件。智力。工具“]”,“published-print”:{“date-parts”:[[2017,6]]},“abstract”:“马尔可夫决策过程(MDP)已成为不确定条件下决策理论规划问题的标准模型之一。在它的标准形式中,奖励被假定为数值加性标量。在本文中,我们对该模型进行了推广,使奖励具有功能性。历史值通过组合奖励函数递归计算。我们表明,文献中提出的几个MDP变体可以在此设置中实例化。然后,我们在这些奖励函数上确定了动态规划有效的充分条件。我们还讨论了无限视界和最大算子不存在的情况。为了展示我们的框架的潜力,我们通过几个示例来总结本文<\/jats:p>“,”DOI“:”10.1142\/s0218213017600144“,”type“:”journal-article“,”created“:{”date-parts“:[[2017,6,22]],”date-time“:”2017-06-22T07:01:36Z“,”timestamp“:1498114896000},”page“::“26”author“:[{”ORCID“:”http://\/ORCID.org\/00000-0002-2008-4569“,”authenticated-ORCID“:false,”given“:“Paul”,”family“:”Weng“,”sequence“:”first“,”affiliation“:[}”name“:”SYSU-CMU Joint Institute of Engineering,Guangzhou,China“}”name:“SYSU-CMU-Joint Research Institutes,China顺德”},{“name”:“”中国广州高等教育中心外环东路132号SYSU电子与信息技术学院“}]},{”given“:”Olivier“,”family“:”Spanjaard“,”sequence“:”additional“,”affiliation“:[{”name“:”巴黎索邦大学\u00e9s,UPMC Univ Paris 06,UMR 7606,LIP6,F-75005,Paris,France“}”,{“name”:“”CNRS,UMR 7606,LIP6,F-75005,法国巴黎“},{“name”:“4 Place Jussieu,75005,Paris,France”}]}],“member”:“219”,“published-online”:{“date-parts”:[[2017,6,22]]},“reference”:[{“key”:“p_2”,“first page”:”394“,“volume”:《199》,“author”:“Littman M.L.”,“journal-title”:“Morgan Kaufmann”},“:”p_3“,”首页“:”1026“,”卷“:”200“,”作者“:”Boyan J.”,“期刊标题”:“NIPS”},{“key”:“p_5”,“首页”:“444”,“卷”:“200”,“作者”:“Regan K.”,“期刊标题”:“Morgan Kaufmann”},{“key”:“p_7”,“doi断言者”:“出版商”,“doi”:“10.1016\/J.jor.2005.03.042”},{“key”:“p_8”,“doi断言者”:“出版商”,“doi”:“10.2307\/1913656”},{“key“:”p_9“,”doi由“:”publisher“断言,”doi“:”10.2307\/1912348“},{“key”:“p_10”,“doi-asserted-by”:“publisher”,“doi”:“10.1016\/S0004-3702(00:“10.2307\/1905540”},{“密钥”:“p_14”,“卷”:“37”,“作者”:“Carmon Y”,“journal-title“:”Operations Research Letters“},{”key“:”p_15“,”doi-asserted-by“:”publisher“,”doi“:”10.1007\/BF01582110“}”,{“key”:“p_16”,“first-page”:“232”,“volume”:”198“,“author”:“Machina M”,“journal-title”:“Mac millan”},“key“”:”p_20“,”“doi-assert-by”:“publisher”,”“doi”:“10.1145\/358172.358406”}],“集装箱标签”:[“国际人工智能工具杂志“],”original-title“:[],”language“:”en“,”link“:[{”URL“:”https:\/\/www.worldscience.com\/doi\/pdf\/10.1142\/S0218213017600144“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:”{“date-parts”:[2019,8,6]],“date-time”:“2019-08-06T09:27:10Z“,”timestamp“:1565083630000},”score“:1,”resource“:{”primary”:{“URL”:“https:\/\/www.worldscience.com\/doi\/abs\/10.1142\/S0218213017600144”}},“subtitle”:[],“short title”:[],“issued”:{“date-parts”:[2017,6]]},《参考计数》:13,“journal-sissue”:{-“issues”:“03”,“publish”在线编辑“:{“date-parts”:[[2017,6,22]]},“published-print”:{date-parts“:[[2017,6]]}},”alternative-id“:[”10.1142\/S0218213017600144“],”URL“:”http://\/dx.doi.org\/10.1142\/s0218213017300144“,”relation“:{},“ISSN”:[“0218-2130”,“1793-6349”],“ISSN-type”:[{“value”:“0218-2330”,“type”:“print”},{“value”:“1793-5349”,“type”:“electronic”}],“主题”:[],“已发布”:{“日期部分”:[[2017,6]]}}}