×

深入学习对响应面进行排序,并应用于最佳停止问题。 (英语) Zbl 1454.91291号

摘要:在本文中,我们提出了响应面排序的深度学习算法,并将其应用于金融数学中的最优停止问题。响应面排序问题的动机是估计随机控制问题中的最优反馈策略图,旨在有效地找到与整个连续输入空间中的最小响应相关的指数。通过将(mathcal{X})中的点视为像素,将最小曲面的索引视为标签,我们将该问题重新描述为图像分割问题,即为图像中每个像素分配一个标签,其中具有相同标签的像素共享某些特征。这为有效解决问题提供了一种替代方法,而不是像我们以前的工作那样使用顺序设计卢德科夫斯克[SIAM/ASA J.Uncertain.Quantif.5,212–239(2017;Zbl 1365.62319号)]. 深度学习算法具有可扩展性、并行性和无模型性,即响应面无需参数假设。考虑将响应面排序作为图像分割,可以使用一类广泛的深度神经网络(NN),例如前馈NN、UNet、SegNet、DeconvNet,这些网络已在该领域得到广泛应用,并通过数值验证具有良好的性能。我们还系统地研究了深度学习算法对均匀网格或顺序设计抽样生成的输入数据的依赖性,并观察到深度学习的性能是对训练数据的噪声和位置(靠近/远离边界)敏感。我们给出了几个例子,包括合成期权和百慕大期权定价问题,以证明该方法的效率和准确性。我们还模拟了一个10维的示例来证明其鲁棒性,而非学习算法通常在如此高的维中存在困难。

MSC公司:

9120国集团 衍生证券(期权定价、对冲等)
60克40 停车时间;最优停车问题;赌博理论
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aid,R.,Campi,L.,Langrené,N.和Pham,H.,最优多次切换问题的概率数值方法及其在发电投资中的应用。SIAM J.财务。数学。, 2014, 5 (1), 191-231. doi:10.1137/120897298·Zbl 1308.93217号 ·doi:10.1137/120897298
[2] Andersen,L.和Broadie,M.,定价多维美式期权的Primal-对偶模拟算法。管理。科学。, 2004, 50 (9), 1222-1234. doi:10.1287/mnsc.1040.0258·doi:10.1287/mnsc.1040.0258
[3] Badrinarayanan,V.、Kendall,A.和Cipolla,R.,SegNet:用于图像分割的深度卷积编码器-解码器架构。IEEE传输。模式分析。机器。智力。, 2017, 39 , 2481-2495. doi:10.10109/TPAMI.2016.22644615·doi:10.1109/TPAMI.2016.2644615
[4] Becker,S.、Cheridito,P.和Jentzen,A.,深度最佳停车,2018年。arXiv:1804.05394·Zbl 1495.60029号
[5] Belomestny,D.,《用非参数回归定价百慕大期权:低估计值的最优收敛速度》。财务。斯托克。,2011年,15655-683。文件编号:10.1007/s00780-010-0132-x·Zbl 1303.91166号 ·文件编号:10.1007/s00780-010-0132-x
[6] Bender,C.,《连续时间内多重行权期权的原始和双重定价》。SIAM J.财务。数学。, 2011, 2 (1), 562-586. 数字对象标识码:10.1137/09077076X·1270.91090兹罗提 ·数字对象标识码:10.1137/09077076X
[7] Binois,M.、Huang,J.、Gramacy,R.B.和Ludkovski,M.,《复制还是探索?随机模拟实验的顺序设计。技术计量学, 2019, 61 (1), 7-23. doi:10.1080/00401706.2018.1469433
[8] 比约克,T,连续时间套利理论2009年(牛津大学出版社)。
[9] Boyle,P.P.,Evnine,J.和Gibbs,S.,多元未定权益的数值评估。财务版次。螺柱。, 1989, 2 (2), 241-250. doi:10.1093/rfs/2.2.241·doi:10.1093/rfs/2.2.241
[10] Broadie,M.和Cao,M.,通过模拟改进美式期权定价的下限和上限算法。数量。财务, 2008, 8 (8), 845-861. doi:10.1080/14697600701763086·Zbl 1154.91430号
[11] Bubeck,S.、Munos,R.和Stoltz,G.,《武装有限和持续武装的强盗的纯粹探索》。西奥。计算。科学。,2011年a,412(19),1832-1852。doi:10.1016/j.tcs.2010.12.059·Zbl 1214.62082号 ·doi:10.1016/j.tcs.2010.12.059
[12] Bubeck,S.、Munos,R.、Stoltz,G.和Szepesvari,C.,X武装匪徒。J.马赫。学习。物件。2011年b月12日,1655-1695·Zbl 1280.91038号
[13] Carrier,J.F.,使用模拟和非参数回归对期权的早期行使价格进行估值。保险:数学。经济学。, 1996, 19 , 19-30. ·Zbl 0894.62109号 ·doi:10.1016/S0167-6687(96)00004-2
[14] Chipman,H.A.、George,E.I.和McCulloch,R.E.,BART:贝叶斯加性回归树。附录申请。斯达。, 2010, 4 (1), 266-298. doi:10.1214/09-AOAS285·Zbl 1189.62066号 ·doi:10.1214/09-AOAS285
[15] 霍利特,F。等。,喀拉拉邦。https://keras.io网址,2015年。
[16] Dozat,T.,将nesterov动量纳入Adam,ICLR 2016。
[17] Gabillon,V.、Ghavamzadeh,M.、Lazaric,A.和Bubeck,S.,多波段最佳手臂识别。神经信息处理系统研究进展第2222-2230页,2011年。
[18] Goudenège,L.、Molent,A.和Zanette,A.,随机波动率和利率下可变年金定价的高斯过程回归,2019a。arXiv预打印arXiv:1903.00369·Zbl 07024664号
[19] Goudenège,L.、Molent,A.和Zanette,A.,高维马尔可夫和非马尔可夫模型中美国期权定价的机器学习,2019b。arXiv预打印arXiv:1905.09474·Zbl 07024664号
[20] Goudenège,L.、Molent,A.和Zanette,A.,用随机利率模型对赫斯顿和黑胆地区的gmwb进行定价和对冲。计算。管理。科学。,2019c,16(1-2),217-248。doi:10.1007/s10287-018-0304-2·Zbl 07024664号 ·doi:10.1007/s10287-018-0304-2
[21] Goudenège,L.、Molent,A.和Zanette,A.,《将方差减少应用于机器学习,为高维百慕大/美国期权定价》,2019d。arXiv预印arXiv:1903.11275·Zbl 07024664号
[22] Gramacy,R.B.和Apley,D.W.,大型计算机实验的局部高斯过程近似。J.计算。图表。斯达。, 2015, 24 (2), 561-578. doi:10.1080/10618602014.914442
[23] Gramacy,R.B.和Ludkovski,M.,最优停止问题的序列设计。SIAM J.财务。数学。, 2015, 6 (1), 748-775. doi:10.1137/140980089·Zbl 1320.91154号 ·doi:10.1137/140980089
[24] Gramacy,R.B.和Polson,N.G.,《用于序列设计和优化的高斯过程模型的粒子学习》。J.计算。图表。斯达。, 2011, 20 (1), 102-118. doi:10.1198/jcgs.2010.09171
[25] Gramacy,R.B.和Taddy,M.,tgp,树高斯过程模型的R包。J.统计软件。, 2012, 33 , 1-48.
[26] Gramacy,R.B.,Taddy,M.和Polson,N.,用于学习和设计的动态树。美国统计协会。, 2011, 106 (493), 109-123. doi:10.1198/jasa.2011.ap09769·Zbl 1396.62158号
[27] Grünewälder,S.、Audibert,J.-Y.、Opper,M.和Shawe-Taylor,J.,《高斯过程强盗问题的遗憾边界》。第十三届国际人工智能与统计会议记录,第273-280页,2010年。
[28] Hateley,J.C.、Roberts,J.、Mylonakis,K.和Yang,X.,使用冻结高斯近似进行深度学习地震子结构检测,2018年。arXiv:1810.06610·Zbl 1435.86002号
[29] He,K.,Zhang,X.,Ren,S.和Sun,J.,图像识别的深度剩余学习,2015。CoRR,abs/1512.03385。
[30] Hepperger,P.,使用方差缩减蒙特卡罗方法对高维百慕大期权进行定价。J.计算。财务。, 2013, 16 (3), 99-126. doi:10.21314/JCF.2013.273·doi:10.21314/JCF.2013.273
[31] Hornik,K.,多层前馈网络的近似能力。神经网络。, 1991, 4 (2), 251-257. doi:10.1016/0893-6080(91)90009-T·doi:10.1016/0893-6080(91)90009-T
[32] Hu,R.和Ludkovski,M.,排序响应面的顺序设计。SIAM/ASA J.不确定性。数量。, 2017, 5 (1), 212-239. doi:10.1137/15M1045168·Zbl 1365.62319号 ·doi:10.1137/15M1045168
[33] Jain,S.和Oosterlee,C.W.,《随机网格捆绑方法:百慕大期权及其希腊人的有效定价》。申请。数学。计算。, 2015, 269 , 412-431. ·Zbl 1410.91486号 ·doi:10.1016/j.amc.2015.07.085
[34] Juneja,S.和Kalra,H.,使用函数近似对美国期权定价的方差减少技术。J.计算。财务。, 2009, 12 (3), 79-102. doi:10.21314/JCF.2009.208·Zbl 1173.91366号 ·doi:10.21314/JCF.2009.208
[35] Kingma,D.和Adam,J.B.,《随机优化方法》,2014年。arXiv预打印arXiv:1412.6980。
[36] Kohler,M.,《基于回归的Monte Carlo美式期权定价方法综述》。应用概率统计的最新发展由L.Devroye、B.Karasözen、M.Kohler和R.Korn编辑,第37-58页,2010年。(施普林格:柏林-海德堡)·Zbl 1203.91295号 ·doi:10.1007/978-3-7908-2598-52
[37] Lai,G.、Wang,M.X.、Kekre,S.、Scheller-Wolf,A.和Secomandi,N.,液化天然气终端储存的评估。操作。物件。, 2011, 59 (3), 602-616. doi:10.1287/opre.1100.0909·Zbl 1230.91058号 ·doi:10.1287/opre.1100.0909
[38] LeCun,Y.和Bengio,Y.,深度学习。自然, 2015, 521 , 436-444. doi:10.1038/nature14539·doi:10.1038/nature14539
[39] Létourneau,P.和Stentoft,L.,通过强制结构改进最小二乘蒙特卡罗方法。数量。财务, 2014, 14 (3), 495-507. doi:10.1080/14697688.2013.787543·Zbl 1294.91190号
[40] Lin,J.和Ludkovski,M.,隐马尔可夫随机动力学模型中的序贯贝叶斯推断及其在季节性流行病检测和应对中的应用。统计计算。, 2014, 24 (6), 1047-1062. 数字对象标识代码:10.1007/s11222-013-9419-z·Zbl 1332.62272号 ·数字对象标识代码:10.1007/s11222-013-9419-z
[41] Longstaff,F.A.和Schwartz,E.S.,《通过模拟评估美国期权:简单的最小二乘法》。财务版次。螺柱。, 2001, 14 , 113-147. doi:10.1093/rfs/14.1.113·Zbl 1386.91144号 ·doi:10.1093/rfs/14.1.113
[42] Ludkovski,M.,《百慕大期权定价的克里金元模型和实验设计》。J.计算。财务。, 2018, 22 (1), 37-77. doi:10.21314/JCF.2018.347·doi:10.21314/JCF.2018.347
[43] Ludkovski,M.和Niemi,J.,《流感管理的最佳动态政策》。统计委员会。感染。数字化信息系统。,2010,2(1),第5条(电子版)。
[44] Ludkovski,M.和Niemi,J.,使用随机模拟的最佳疾病爆发决策。冬季模拟会议(WSC)会议记录2011年,第3844-3853页。IEEE,亚利桑那州凤凰城,2011年。
[45] Lyu,X.,Binois,M.和Ludkovski,M.,评估高斯过程元模型和噪声水平集估计的序列设计,2018年。arXiv预打印arXiv:1807.06712。
[46] Meinshausen,N.和Hambly,B.M.,多重行使期权估价的蒙特卡罗方法。数学。财务。,2004年,14(4),557-583。doi:10.1111/j.0960-1627.2004.00205.x·Zbl 1169.91372号 ·doi:10.1111/j.0960-1627.2004.00205.x
[47] Merl,D.、Johnson,R.、Gramacy,R.B.和Mangel,M.,流行病干预适应性管理的统计框架。公共科学图书馆,2009,4(6),e5087。doi:10.1371/journal.pone.0005807·doi:10.1371/journal.pone.0005807
[48] Picheny,V.、Ginsbourger,D.、Roustant,O.、Haftka,R.T.和Kim,N.-H.,《精确逼近目标区域的自适应实验设计》。J.机械。设计。, 2010, 132 , 071008. 数字对象标识代码:10.1115/1.4001873·数字对象标识代码:10.1115/1.4001873
[49] Ranjan,P.、Bingham,D.和Michailidis,G.,复杂计算机代码轮廓估计的序贯实验设计。技术计量学, 2008, 50 (4), 527-541. doi:10.1198/00401700800000541
[50] Reddi,S.J.、Kale,S.和Kumar,S.,《亚当及其后的融合》,2018年。arXiv预打印arXiv:1904.09237。
[51] Ronneberger,O.,Fischer,P.和Brox,T.,U-net:生物医学图像分割的卷积网络。2015年MICCAI:第18届国际会议医学图像计算和计算机辅助干预2015年10月5日至9日,德国慕尼黑,第234-241页。
[52] Roustant,O.,Ginsbourger,D.和Deville,Y.,Dicekriging,diceOptim:两个R包,用于通过基于kriging-based元建模和优化的计算机实验分析。J.统计软件。, 2012, 51 (1), 1-51. doi:10.18637/jss.v051.i01·doi:10.18637/jss.v051.i01
[53] Shelhamer,E.、Long,J.和Darrell,T.,《语义分割的完全卷积网络》。2015 IEEE计算机视觉和模式识别会议(CVPR)马萨诸塞州波士顿,第3431-3440页,2015年。
[54] Springenberg,J.T.、Dosovitskiy,A.、Brox,T.和Riedmiller,M.A.,《力求简单:全卷积网络》,2014年。CoRR,腹肌/1412.6806。
[55] Tsitsiklis,J.N.和Van Roy,B.,复杂美国式期权定价的回归方法。IEEE传输。神经网络。, 2001, 12 (4), 694-703. 数字对象标识代码:10.1109/72.935083·数字对象标识代码:10.1109/72.935083
[56] Weinan,E.,Han,J.和Li,Q.,深度学习的平均场最优控制公式。Res.数学。科学。, 2019, 6 , 10. doi:10.1007/s40687-018-0172-y·Zbl 1421.49021号 ·doi:10.1007/s40687-018-0172-y
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。