×

响应面排序的深度学习及其在最优停止问题中的应用。 (英语) Zbl 1454.91291

摘要:在这篇文章中,我们提出了深度学习算法来排序响应面,并应用于金融数学中的最优停止问题。响应面排序问题是由随机控制问题中最优反馈策略映射的估计而来的,目的是在整个连续输入空间(mathcal{X}\subsetq\mathbb{R}^d\)中有效地找到与最小响应相关的指标。通过将【(\mathcal{X}\)中的点作为像素,以最小曲面的索引作为标签,我们将该问题转化为一个图像分割问题,该问题将标签分配给图像中的每个像素,其中具有相同标签的像素具有某些特征。这提供了一种有效解决问题的替代方法,而不是像我们以前的工作中那样使用顺序设计M、 卢德科夫斯克[SIAM/ASA J.《不确定数量》,5212-239(2017年;Zbl 1365.62319号)]. 深度学习算法具有可扩展性、并行性和无模型性,即响应面不需要参数假设。将响应面排序作为图像分割的依据,可以使用广泛的深度神经网络(NNs),如前馈NNs、UNet、SegNet、devnet等,这些神经网络已经得到广泛的应用,并被数值证明具有良好的性能。我们还系统地研究了深度学习算法对输入数据的依赖性,并观察到深度学习的性能对噪声和训练数据的位置(靠近/远离边界)敏感。我们给出了几个例子,包括综合实例和百慕大期权定价问题,以说明该方法的有效性和准确性。我们还模拟了一个10维的例子来证明其鲁棒性,而非学习算法在如此高的维数下通常有困难。

理学硕士:

91G20 衍生证券(期权定价、对冲等)
60克40 停车时间;最优停车问题;赌博理论
PDF格式 BibTeX公司 XML 引用

参考文献:

[1] Aid,R.,Campi,L.,Langrené,N.和Pham,H.,最优多重开关问题的概率数值方法及其在发电投资中的应用。暹罗J.金融。数学。,2014年,5(1),191-231.doi:10.1137/120897298·Zbl 1308.93217
[2] Andersen,L.和Broadie,M.,多维美式期权定价的原始-对偶模拟算法。管理。科学。,2004年,50(9),1222-1234.doi:10.1287/mnsc.1040.0258
[3] Badrinarayanan,V.,Kendall,A.和Cipolla,R.,SegNet:一种用于图像分割的深卷积编解码器体系结构。IEEE传输。肛门模式。机器。因特尔。,2017年,第39期,2481-2495页。doi:10.1109/TPAMI.2016.2644615
[4] Becker,S.,Cheridito,P.和Jentzen,A.,深度最佳停车,2018年。arXiv:1804.05394·Zbl 07064054
[5] Belomestny,D.,通过非参数回归对百慕大期权定价:低估计的最优收敛速度。金融。斯托奇。,2011年,15,655-683.doi:10.1007/s0780-010-0132-x·Zbl 1303.91166号
[6] Bender,C.,连续时间内多重行使期权的原始和双重定价。暹罗J.金融。数学。,2011年,2(1),562-586.doi:10.1137/09077076X·Zbl 1270.91090
[7] 比诺伊斯,M.,黄,J.,Gramacy,R.B.和Ludkovski,M.,复制还是探索?随机模拟实验的序贯设计。技术计量学,2019年,61(1),7-23.doi:10.1080/00401706.2018.1469433
[8] 比约克,T,连续时间套利理论,2009年(牛津大学出版社)。
[9] Boyle,P.P.,Evnine,J.和Gibbs,S.,多元未定权益的数值评估。财务修订版。螺柱。,1989年,2(2),241-250.doi:10.1093/rfs/2.2.241
[10] Broadie,M.和Cao,M.,通过模拟改进了美式期权定价的上限和下限算法。数量。财务,2008年,8(8),845-861.doi:10.1080/14697680701763086·Zbl 1154.91430
[11] Bubeck,S.,Munos,R.和Stoltz,G.,《有限武装和持续武装匪徒的纯粹探索》。理论。计算机。科学。,2011a,412(19),1832-1852.doi:10.1016/j.tcs.2010.12.059·Zbl 1214.62082
[12] Bubeck,S.,Munos,R.,Stoltz,G.和Szepesvari,C.,X武装匪徒。J、 马赫。学习。物件。,2011年b月12日,1655-1695年·Zbl 1280.91038
[13] Carriere,J.F.,使用模拟和非参数回归评估期权的早期行使价格。输入:数学。经济。1996年,19日,19日至30日·Zbl 0894.62109
[14] Chipman,H.A.,George,E.I.和McCulloch,R.E.,BART:贝叶斯加性回归树。安。申请。斯达。,2010年,4(1),266-298.doi:10.1214/09-AOAS285·Zbl 1189.62066
[15] 乔利特,F。等等。,卡拉斯。https://keras.io,2015年。
[16] Dozat,T.,将nesterov动量纳入Adam,ICLR 2016。
[17] Gabillon,V.,Ghavamzadeh,M.,Lazaric,A.和Bubeck,S.,多强盗最佳武器识别。神经信息处理系统的研究进展,第2222-2230页,2011年。
[18] Goudenège,L.,Molent,A.和Zanette,A.,具有随机波动率和利率的可变年金定价的高斯过程回归,2009年A。arXiv预印本arXiv:1903.00369·Zbl 07024664
[19] Goudenège,L.,Molent,A.和Zanette,A.,高维马尔科夫和非马尔科夫模型中美式期权定价的机器学习,2019年b。arXiv预印本arXiv:1905.09474·Zbl 07024664
[20] Goudenège,L.,Molent,A.和Zanette,A.,heston和black-scholes中随机利率模型的gmwb定价和对冲。计算机。管理。科学。,2019c,16(1-2),217-248.doi:10.1007/s10287-018-0304-2·Zbl 07024664
[21] Goudenège,L.,Molent,A.和Zanette,A.,《方差减少应用于机器学习在高维百慕大/美式期权定价中的应用》,2019d。arXiv预印本arXiv:1903.11275·Zbl 07024664
[22] Gramacy,R.B.和Apley,D.W.,大型计算机实验的局部高斯过程近似。J、 计算机。图表。斯达。,2015年,24(2),561-578.doi:10.1080/10618600.2014.914442
[23] Gramacy,R.B.和Ludkovski,M.,最优停止问题的顺序设计。暹罗J.金融。数学。,2015年,6(1),748-775.doi:10.1137/140980089·Zbl 1320.91154
[24] Gramacy,R.B.和Polson,N.G.,用于顺序设计和优化的高斯过程模型的粒子学习。J、 计算机。图表。斯达。,2011年,第20(1),102-118页
[25] Gramacy,R.B.和Taddy,M.,tgp,一个用于三阶高斯过程模型的R包。J、 统计软件。2012年,第33页,第1-48页。
[26] Gramacy,R.B.,Taddy,M.和Polson,N.,动态学习和设计树。J、 上午。统计协会。,2011年,106(493),109-123.doi:10.1198/jasa.2011.ap09769·Zbl 1396.62158
[27] Grünewälder,S.,Audibert,J.-Y,Opper,M.和Shawe Taylor,J.,高斯过程bandit问题的后悔界。第十三届国际人工智能与统计会议论文集,第273-2802010页。
[28] Hateley,J.C.,Roberts,J.,Mylonakis,K.和Yang,X.,使用冻结高斯近似的深度学习地震子结构检测,2018年。arXiv:1810.06610·Zbl 1435.86002号
[29] 何K,张,X,任,S.和孙,J.,用于图像识别的深度剩余学习,2015年。校正,abs/1512.03385。
[30] Hepperger,P.,使用方差缩减蒙特卡罗方法定价高维百慕大期权。J、 计算机。金融。,2013年,16(3),99-126.doi:10.21314/JCF.2013.273
[31] Hornik,K.,多层前馈网络的逼近能力。神经网络。,1991年,第4(2),251-257页
[32] Hu,R.和Ludkovski,M.,响应面排序的顺序设计。暹罗/ASA J.不确定。匡提夫。,2017年,5(1),212-239.doi:10.1137/15M1045168·Zbl 1365.62319号
[33] Jain,S.和Oosterlee,C.W.,随机网格捆绑方法:百慕大期权及其希腊人的有效定价。申请。数学。计算机。,2015年,第269期,第412-431页·Zbl 1410.91486
[34] Juneja,S.和Karla,H.,使用函数近似对美式期权定价的方差缩减技术。J、 计算机。金融。,2009年,12(3),79-102.doi:10.21314/JCF.2009.208·Zbl 1173.91366
[35] Kingma,D.和Adam,J.B.,随机优化方法,2014年。arXiv预印本arXiv:1412.6980。
[36] Kohler,M.,基于回归的美式期权定价蒙特卡罗方法述评。应用概率统计的最新进展,由L.Devroye、B.Karasözen、M.Kohler和R.Korn编辑,第37-58页,2010年·Zbl 1203.91295
[37] Lai,G.,Wang,M.X.,Kekre,S.,Scheller-Wolf,A.和Secomandi,N.,《液化天然气终端储存评估》。操作。物件。,2011年,59(3),602-616.doi:10.1287/opre.1100.0909·Zbl 1230.91058
[38] LeCun,Y.和Bengio,Y.,深度学习。自然,2015年,521,436-444.doi:10.1038/nature14539
[39] Létourneau,P.和Stentoft,L.,通过施加结构改进最小二乘蒙特卡罗方法。数量。财务,2014年,14(3),495-507.doi:10.1080/14697688.2013.787543·Zbl 1294.91190号
[40] Lin,J.和Ludkovski,M.,隐马尔可夫随机动力学模型中的序贯贝叶斯推断及其在季节性流行病检测和响应中的应用。统计计算。,2014年,24(6),1047-1062.doi:10.1007/s11222-013-9419-z·Zbl 1332.62272
[41] Longstaff,F.A.和Schwartz,E.S.,通过模拟评估美国期权:一种简单的最小二乘法。财务修订版。螺柱。,2001年,第14期,第113-147页·Zbl 1386.91144
[42] Ludkovski,M.,百慕大期权定价的Kriging元模型和实验设计。J、 计算机。金融。,2018年,22(1),37-77.doi:10.21314/JCF.2018.347
[43] Ludkovski,M.和Niemi,J.,流感管理的最优动态政策。公共统计局。感染。数字化信息系统。,2010,2(1),第5条(电子)。
[44] Ludkovski,M.和Niemi,J.,使用随机模拟的最优疾病爆发决策。冬季模拟会议论文集(WSC),2011年,第3844-3853页。IEEE,凤凰城,亚利桑那州,2011年。
[45] Lyu,X.,Binois,M.和Ludkovski,M.,用于噪声水平集估计的高斯过程元模型和序列设计,2018年。arXiv预印本arXiv:1807.06712。
[46] Meinshausen,N.和Hambly,B.M.,多重行使期权估价的蒙特卡罗方法。数学。金融。,2004年,14(4),557-583.doi:10.1111/j.0960-1627.2004.00205.x·Zbl 1169.91372
[47] Merl,D.,Johnson,R.,Gramacy,R.B.和Mangel,M.,流行病学干预适应性管理的统计框架。公共科学图书馆一号,2009年,4(6),e5087.doi:10.1371/journal.pone.0005807
[48] 皮切尼,V.,金斯堡,D.,罗森特,O.,哈夫特卡,R.T.和金,N.-H,精确逼近目标区域的自适应实验设计。J、 机械。Des公司。,2010年,132071008.doi:10.1115/1.4001873
[49] Ranjan,P.,Bingham,D.和Michailidis,G.,从复杂计算机代码进行轮廓估计的序贯实验设计。技术计量学,2008年,50(4),527-541.doi:10.1198/00401700800000541
[50] Reddi,S.J.,Kale,S.和Kumar,S.,关于亚当和超越的融合,2018年。arXiv预印本arXiv:1904.09237。
[51] Ronneberger,O.,Fischer,P.和Brox,T.,U-net:生物医学图像分割的卷积网络。MICCAI 2015:医学图像计算和计算机辅助干预,第18届国际会议,德国慕尼黑,2015年10月5日至9日,第234-241页。
[52] Roustant,O.,Ginsbourger,D.和Deville,Y.,Dicekriging,diceOptim:两个R包,用于通过基于kriging的元建模和优化分析计算机实验。J、 统计软件。,2012年,51(1),1-51.doi:10.18637/jss.v051.i01
[53] Shelhamer,E.,Long,J.和Darrell,T.,语义分割的完全卷积网络。2015年IEEE计算机视觉与模式识别会议(CVPR),马萨诸塞州波士顿,第3431-3440页,2015年。
[54] Springenberg,J.T.,Dosovitskiy,A.,Brox,T.和Riedmiller,M.A.,力求简单:全卷积网,2014年。CoRR,abs/1412.6806。
[55] Tsitsiklis,J.N.和Van Roy,B.,《复杂美式期权定价的回归方法》。IEEE传输。神经网络。,2001年,12(4),694-703.doi:10.1109/72.935083
[56] Weinan,E.,Han,J.和Li,Q.,深度学习的平均场最优控制公式。Res.数学。科学。,2019年6月10日。doi:10.1007/s40687-018-0172-y·Zbl 1421.49021
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。