×

快速值迭代:勒让德-芬奇对偶在离散时间的一类确定性动态规划问题中的应用。 (英语) Zbl 1441.90173号

摘要:我们提出了一种算法,我们称之为“快速值迭代”(FVI),用于计算离散时间内确定性无穷大动态规划问题的值函数。FVI是一种有效的算法,适用于一类具有凹回报(或凸成本)函数和线性约束的多维动态规划问题。在该算法中,通过反复应用一个简单的代数规则(涉及返回函数的Legendre-Fenchel变换),从零函数开始生成函数序列。所得序列保证收敛,且极限函数的勒让德-芬奇变换与值函数一致。

MSC公司:

90立方厘米 动态编程
46N10号 函数分析在优化、凸分析、数学规划、经济学中的应用

软件:

钠13
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Acemoglu,D.,《现代经济增长导论》(2009),普林斯顿大学出版社:普林斯顿大学出版·Zbl 1158.91001号
[2] 阿基安,M。;Gaubert,S.,凸单调齐次映射的谱定理,遍历控制,非线性分析。,52, 637-679 (2003) ·Zbl 1030.47048号 ·doi:10.1016/S0362-546X(02)00170-0
[3] 贝尔曼,R。;Karush,W.,《数学编程与最大值变换》,SIAM J.Appl。数学。,10550-567(1962年)·Zbl 0106.14002号 ·doi:10.1137/011042
[4] 贝尔曼,R。;卡鲁什,W.,《关于最大变换和变换半群》,布尔。阿默尔。数学。Soc.,68,516-518(1962)·Zbl 0108.33302号 ·doi:10.1090/S0002-9904-1962-10802-7
[5] 贝尔曼,R。;Karush,W.,《动态规划理论中的函数方程XII:最大变换的应用》,J.Math。分析。申请。,155-157年6月(1963年)·兹伯利0121.14704 ·doi:10.1016/0022-247X(63)90099-4
[6] 贝尔曼,R。;Karush,W.,《关于最大值变换》,J.Math。分析。申请。,6, 67-74 (1963) ·Zbl 0129.09301号 ·doi:10.1016/0022-247X(63)90093-3
[7] 伯曼,A。;Plemmons,R.J.,《数学科学中的非负矩阵》(1994),SIAM:SIAM,费城·兹伯利0815.15016
[8] Esogbue,A.O。;Ahn,C.W.,一类高维动态规划算法的计算实验,计算。数学。申请。,19, 3-23 (1990) ·Zbl 0724.90078号 ·doi:10.1016/0898-1221(90)90144-9
[9] Fenchel,W.,关于共轭凸函数,Canad。数学杂志。,1, 73-77 (1949) ·兹伯利0038.20902 ·doi:10.4153/CJM-1949-007-x
[10] Hiriart-Urruti,J.B.,《函数差分共轭的一般公式》,加拿大。数学。公牛。,29, 482-485 (1986) ·Zbl 0608.90087号 ·doi:10.4153/CBM-1986-076-7
[11] Hiriart-Urruti,J.B.,关于凸复合函数的Legendre-Fenchel变换的注释,非光滑力学与分析,Springer,纽约,2006年,第35-46页。
[12] Kamihigashi,T.,《关于非平稳确定性动态规划的最优性原则》,国际经济杂志。理论,4519-525(2008)·doi:10.1111/j.1742-7363.2008.0092.x
[13] Kamihigashi,T.,《动态规划的序理论方法:一个阐述》,《经济学》。理论牛市。,2, 13-21 (2014) ·doi:10.1007/s40505-013-0022-4
[14] Kamihigashi,T.,动态规划Bellman方程解的基本结果:存在性、唯一性和收敛性,经济理论,56,1-23(2014)·兹比尔1327.90361 ·文件编号:10.1007/s00199-013-0789-4
[15] Kamihigashi,T。;Reffett,K。;Yao,M.,《Kleene不动点定理在动态规划中的应用:注释》,《国际经济杂志》。理论,11429-434(2015)·Zbl 1394.90551号 ·doi:10.1111/ijet.12074
[16] Kestelman,H.,《带\(####\)和\(####\)的矩阵》,美国数学。周一。,E23791059-1060(1973)·doi:10.2307/2318791
[17] Klein,C.M.,《共轭对偶及其在动态规划中的意义》,数学。计算。型号。,14, 151-154 (1990) ·Zbl 0724.90079号 ·doi:10.1016/0895-7177(90)90165-J
[18] 克莱因,C.M。;Morin,T.L.,《共轭二元性与维度诅咒》,《欧洲期刊·Oper》。研究,50,220-228(1991)·Zbl 0734.90109号 ·doi:10.1016/0377-2217(91)90244-P
[19] Lucet,Y.,比快速勒让德变换(线性时间勒让德转换,Numer)更快。算法,16171-185(1997)·Zbl 0909.65037号 ·doi:10.1023/A:1019191114493
[20] Morin,T.L。;Esogbue,A.M.O.,降低高维动态程序维数的嵌入状态空间方法,J.Math。分析。申请。,48801-810(1974年)·Zbl 0321.49023号 ·doi:10.1016/0022-247X(74)90154-1
[21] Murota,K.,离散凸分析(2003),SIAM:SIAM,费城·Zbl 1029.90055号
[22] Puterman,M.L.,《马尔可夫决策过程:离散随机动态规划》(Markov Decision Processes:Discrete Stochastic Dynamic Programming)(2005),John Wiley&Sons:John Willey&Sons,新泽西州霍博肯·Zbl 1184.90170号
[23] Rockafellar,R.T。;Wets,R.J.B.,变分分析(2009),施普林格:施普林格,多德雷赫特
[24] 斯托基,N。;Lucas Jr.,R.E.,《经济动力学中的递归方法》(1989),哈佛大学出版社:哈佛大学出版社,马萨诸塞州剑桥·Zbl 0774.90018号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。