×

变量折扣动态规划在迭代函数系统及相关问题中的应用。 (英语) Zbl 1415.37024号

摘要:我们研究了与序列决策过程相关的一大类非线性变量折扣转移算子不动点解的存在唯一性。我们建立了这些解关于即时回报和可变折扣的正则性。此外,我们将我们的方法应用于在动态规划环境下,重新构造和求解迭代函数系统理论、马尔可夫决策过程、离散Aubry-Mather理论、Sinai-Ruelle-Bowen测度、脂肪螺线吸引子和遍历优化中的一些中心变分问题。

MSC公司:

37C30个 动力系统中的泛函分析技术;zeta函数、(Ruelle-Frobenius)转移算子等。
37天35分 热力学形式主义,变分原理,动力系统的平衡态
90立方厘米 动态编程
49升20 最优控制与微分对策中的动态规划
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bhakta P C和Choudhury S R 1988动态规划中函数方程的一些存在性定理。数学杂志。分析。申请。131 217-31 ·Zbl 0662.90085号 ·doi:10.1016/0022-247X(88)90201-6
[2] Baraviera A T、Cioletti L、Lopes A O、Mohr J和Souza R R 2011关于一般一维XY模型:正温度和零温度、选择和非选择数学复习。物理学。23 1063-113 ·Zbl 1362.37022号 ·doi:10.1142/S0129055X11004527
[3] Bellman R 1957年动态编程(新泽西州普林斯顿:普林斯顿大学出版社)·Zbl 0077.13605号
[4] Berge C 1997年拓扑空间:包括多值函数、向量空间和凸性的处理(纽约:多佛)(E M Patterson译自法语原文,1963年重印)
[5] Bertsekas D P 2013年抽象动态规划(马萨诸塞州贝尔蒙特:雅典娜科学公司)·Zbl 1312.90086号
[6] Biryuk A和Gomes D A 2010 Aubry-Mather理论简介圣保罗数学。科学。4 17-63 ·Zbl 1243.49001号 ·doi:10.11606/issn.2316-9028.v4i1p17-63
[7] Bamón R、Kiwi J、Rivera-Letelier J和Urzüa R 2006关于圆柱体螺线管吸引子的拓扑安娜·亨利·彭加雷研究所。非利奈尔23 209-36 ·Zbl 1092.37017号 ·doi:10.1016/j.anihpc.2005.03.002
[8] Bhakta P C和Mitra S 1984动态规划中函数方程的一些存在性定理数学杂志。分析。申请。98 348-62 ·Zbl 0533.90091号 ·doi:10.1016/0022-247X(84)90254-3
[9] Bousch T 2001沃尔特斯条件科学年鉴。埃科尔规范。超级。34 287-311 ·Zbl 0988.37036号 ·doi:10.1016/s0012-9593(00)01062-4
[10] Chang S-S和Ma Y H 1991混合单调凝聚算子的耦合不动点和动态规划中一类函数方程解的存在性定理数学杂志。分析。申请。160 468-79 ·Zbl 0753.47029号 ·doi:10.1016/0022-247X(91)90319-U
[11] Clarke F H和Vinter R B 1987最大值原理与动态规划之间的关系SIAM J.控制优化。25 1291-311 ·Zbl 0642.49014号 ·doi:10.1137/0325071
[12] del Valle Y、Venayagamoorthy G K、Mohagheghi S、Hernandez J C和Harley R G 2008粒子群优化:基本概念、变量和在电力系统中的应用IEEE传输。进化计算。12 171-95 ·doi:10.1109/TEVC.2007.896686
[13] Fathi A 1997解决方案KAM faibles concugueées et barrières de PeierlsC.R.学院。科学。巴黎I 325 649-52号·Zbl 0943.37031号 ·doi:10.1016/S0764-4442(97)84777-5
[14] Fathi A 1997年Théorème KAM faible et theéorie de Mather sur les systèmes lagrangensC.R.学院。科学。巴黎I 324 1043-6号·Zbl 0885.58022号 ·doi:10.1016/S0764-4442(97)87883-4
[15] Fathi A 1998年轨道hétéroclines和Peierls组合C.R.学院。科学。巴黎I 326 1213-6号·Zbl 0915.58033号 ·doi:10.1016/S0764-4442(98)80230-9
[16] Fathi A 1998 Lax-Oleinik半群收敛C.R.学院。科学。巴黎我327 267-70·Zbl 1052.37514号 ·doi:10.1016/S0764-4442(98)80144-4
[17] Fan A H和Lau K-S 1999迭代函数系统和Ruelle算子数学杂志。分析。申请。231 319-44 ·Zbl 1029.37014号 ·doi:10.1006/jmaa.1998.6210
[18] Gheshlaghi Azar M、Gómez V和Kappen H J 2012动态政策规划J.马赫。学习。物件。13 3207-45年·兹比尔1436.90148
[19] 加里波第E 2017扩展情况下的遍历优化:概念、工具和应用(施普林格数学简介)(柏林:施普林格)(https://doi.org/10.1007/978-3-319-66643-3) ·兹伯利1417.37016 ·doi:10.1007/978-3-319-66643-3
[20] Gomes D A和Oliveira E R 2012马瑟问题和固定设置下的粘度解决方案圣保罗数学。科学。6 301-34 ·Zbl 1293.49061号 ·doi:10.11606/issn.2316-9028.v6i2p301-334
[21] Gomes D A 2005粘度求解方法和离散Aubry-Mather问题离散连续动态。系统。13 103-16 ·Zbl 1080.49022号 ·doi:10.3934/dcds.2005.13.103
[22] Gomes D A 2008广义Mather问题及粘度解和Mather测度的选择原则高级计算变量。1 291-307 ·Zbl 1181.37090号 ·doi:10.1515/ACV.2008.012
[23] Jenkinson O 2018动力系统中的遍历优化埃尔戈德。西奥。发电机。系统。1-26接受(https://doi.org/10.1017/etds.2017.142) ·Zbl 1435.37009号
[24] Ja sh kiewicz A、Matkowski J和Nowak A S 2013具有广义折扣的随机动态规划中的持久最优策略数学。操作。物件。38 108-21 ·Zbl 1291.90290号 ·doi:10.1287/门1120.0561
[25] Ja sh kiewicz A、Matkowski J和Nowak A S 2014无边界回报动态规划中的广义折扣操作。Res.Lett公司。42 231-3 ·Zbl 1408.90305号 ·doi:10.1016/j.org.2014.03.004
[26] Jaśkiewicz A,Matkowski J和Nowak A S 2014关于动态规划中的变量贴现:在资源开采和其他经济模型中的应用安·Oper。物件。220 263-78 ·Zbl 1309.90119号 ·doi:10.1007/s10479-011-0931-2
[27] Liu Z 2001动态规划中一类函数方程解的存在性定理数学杂志。分析。申请。262 529-53 ·Zbl 1018.90064号 ·doi:10.1006/jmaa.2001.7551
[28] Lopes A O,Mengue J K,Mohr J和Souza R R 2015具有一般先验概率的一维晶格系统的熵和变分原理:正温度和零温度埃尔戈德。西奥。发电机。系统。35 1925-61 ·Zbl 1352.37090号 ·doi:10.1017/etds.2014.15
[29] Lopes A O和Oliveira E R 2018关于脂肪吸引子的薄边界建模、动力学、优化和生物经济学III第244卷ed A Pinto和D Zilberman(柏林:Springer)第205-46页·数字对象标识代码:10.1007/978-3-319-74086-7_10
[30] Matkowski J 1975函数方程的可积解数学学位论文。127 68 ·Zbl 0318.39005号
[31] MañéR 1992关于拉格朗日动力系统的极小化测度非线性5 623-38 ·Zbl 0799.58030号 ·doi:10.1088/0951-7715/5/3/001
[32] MañéR 1996拉格朗日系统最小化测度的一般性质和问题非线性9 273-310 ·Zbl 0886.58037号 ·doi:10.1088/0951-7715/9/2/002
[33] Puterman M L 1994年马尔可夫决策过程:离散随机动态规划(概率与数理统计威利级数:应用概率与统计)(纽约:威利)·Zbl 0829.90134号 ·doi:10.1002/9780470316887
[34] Rockafellar R T 1966凸函数Fenchel对偶定理的推广杜克大学数学。J。33 81-9 ·Zbl 0138.09301号 ·doi:10.1215/S0012-7094-66-03312-6
[35] Theodorou E A,Buchli J和Schaal S 2010强化学习的广义路径积分控制方法J.马赫。学习。物件。11 3137-81 ·Zbl 1242.68254号
[36] Tsujii M 2001脂肪螺线管吸引子非线性14 1011-27 ·Zbl 1067.37028号 ·doi:10.1088/0951-7715/14/5/306
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。