×

通过限价订单进行最优清算:一种神经网络和模拟方法。 (英语) 兹比尔1518.91265

摘要:我们提出了一种基于仿真和神经网络的学习算法,用于使用动态规划解决具有大状态空间的随机最优控制问题。问题在于通过限额订单(LOB)清算给定数量的股票。状态空间包括LOB中每个级别的价格和数量。目标是使预期清算收益最大化。股票通过与LOB中的当前限额订单相匹配的市场订单出售,并对LOB的未来演变产生影响。采用基于神经网络的性能和值迭代过程的混合形式获得最优策略。通过深度学习分类任务估计LOB的概率分布。该模型在通过纽约证券交易所Arcbook交易的12只股票上进行了测试,数值实现表明,该模型在很大程度上优于文献中最常见的最优清算模型。

MSC公司:

91G15型 金融市场
93年20日 最优随机控制
49升20 最优控制与微分对策中的动态规划
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ackermann,J。;Kruse,T。;乌鲁索夫,M.,随机订单模型中最优贸易执行的Cádlág半鞅策略,金融与随机,25757-810(2021)·Zbl 1476.91166号
[2] 北阿巴扎德。;Tekin,C。;Van der Schaar,M.,《限额订单交易执行中的在线学习》,IEEE Trans Signal Process,66,4626-4641(2018)·Zbl 1414.68041号
[3] 阿方西,A。;水果,A。;Schied,A.,《具有一般形状函数的极限订单簿中的最优执行策略》,《定量金融》,2010年第10期,第143-157页·Zbl 1185.91199号
[4] Almgren,R.,《随机流动性和波动性的最优交易》,SIAM J Finance Math,3163-181(2012)·Zbl 1256.49031号
[5] Almgren R,Chriss N(1999),清算中的价值。风险1999年12月
[6] Bachouch,A。;胡雷,C。;Pham,H。;Langrené,N.,有限水平随机控制问题的深度神经网络算法:数值计算,Methodol Comput Appl Prob,24,143-178(2022)·Zbl 1496.93112号
[7] Barrera-Esteve,C。;Bergeret,F。;剂量,C。;戈贝,E。;Meziou,A。;穆诺斯,R。;Reboul Salze,D.,波动期权定价的数值方法:随机控制方法,Methodol Comput Appl Prob,8517-540(2006)·Zbl 1142.91502号
[8] Bayraktar,E。;Ludkovski,M.,《强度可控的限额指令簿中的清算》,《数学金融》,24,627-650(2014)·Zbl 1314.91247号
[9] Becherer,D。;Bilarev,T。;Frentrup,P.,《随机流动性下的最优清算》,《金融与随机》,22,39-68(2018)·Zbl 1391.91164号
[10] Belomestny,D。;哈夫纳,S。;Urusov,M.,基于回归的嵌套蒙特卡罗方法复杂性降低,SIAM金融数学杂志,9,665-689(2018)·Zbl 1415.91314号
[11] Bertsekas D,Tsitsiklis J(1995)《神经动力学编程:概述》。1995年第34届IEEE决策与控制会议记录:560-564
[12] Broadie M,Glasserman P,Ha Z(2000)使用具有优化权重的随机网格模拟美式期权定价。概率约束优化(第26-44页)。马萨诸塞州波士顿斯普林格·Zbl 1013.91054号
[13] Buehler,H。;Gonon,L。;Teichmann,J.等人。;Wood,B.,《深度对冲》,Quant Finance,第19期,1271-1291页(2019年)·Zbl 1420.91450
[14] Carbonneau,A。;Godin,F.,《深度对冲衍生工具的等风险定价》,广发金融,21593-608(2021)·Zbl 1476.91177号
[15] 卡莫纳,R。;Ludkovski,M.,《使用最优切换定价资产调度灵活性》,《应用数学金融》,第15期,第405-447页(2008年)·Zbl 1156.91361号
[16] 卡特亚,A。;Jaimungal,S.,《限额和市场订单的最优执行》,《Quant Finance》,第15期,1279-1291页(2015年)·Zbl 1406.91403号
[17] 卡特亚,A。;南加尔。;Penalva,J.,《算法与高频交易》(2015),剑桥大学出版社·Zbl 1332.91001号
[18] 卡特亚,A。;南加尔。;Ricci,J.,《低买高卖:高频交易视角》,SIAM金融数学期刊,5145-444(2014)·Zbl 1308.91199号
[19] Cartea A、Jaimungal S、Sanchez-Betancourt L(2021)算法交易的深度强化学习。https://ssrn.com/abstract=3812473
[20] Chevalier E,Ly Vath V,Roch A,Scotti S(2016)通过限价指令市场进行清算的最佳执行成本。国际西奥应用财务杂志19(1)。doi:10.1142/S021902491650047·Zbl 1337.91158号
[21] 续,R。;斯托科夫,S。;Talrej,R.,订单动态的随机模型,Oper Res,58,3,549-563(2010)·Zbl 1232.91719号
[22] Denault,M。;Delage,E。;Simonato,J-G,《动态投资组合选择:模拟与回归方法》,Optim Eng,18,369-406(2017)·Zbl 1370.90306号
[23] Denault,M。;Simonato,J-G,《通过模拟和回归进行动态投资组合选择:重新审视价值函数与投资组合权重递归的问题》,《Comp Oper Res》,79,174-189(2017)·Zbl 1395.91400号
[24] Denault,M。;西蒙纳托,J-G;Stentoft,L.,带有内生状态变量的随机动态程序的模拟和回归方法,Comp Oper Res,402760-2769(2013)·Zbl 1348.90617号
[25] 埃格洛夫,D。;科勒,M。;Todorovic,N.,《百慕大期权定价的动态look-ahead Monte Carlo算法》,《Ann Appl Probab》,第17期,第1138-1171页(2007年)·Zbl 1136.91010号
[26] Germain M,Pham H,Warin X(2021)基于神经网络的随机控制算法和金融PDE。doi:10.48550/arXiv.2101.08068·兹伯利07341723
[27] Glasserman,P。;Yu,B。;尼德雷特,H.,《美国期权模拟:现在回归还是以后回归?》?,蒙特卡罗和准蒙特卡罗方法2002(2004),海德堡:施普林格,柏林,海德伯格·Zbl 1062.91033号
[28] 盖恩特,O。;Lehalle,C.,《最优清算中的一般强度形状》,《数学金融》,25,457-495(2015)·Zbl 1331.91165号
[29] 盖恩特,O。;Lehalle,C.公司。;Tapia,J.,《限额指令下的最优投资组合清算》,SIAM J Finan Math,3740-764(2011)·Zbl 1262.91160号
[30] 吉尔鲍德,F。;Pham,H.,《限制和市场订单的最佳高频交易》,《Quant Finance》,2013年第13期,第79-94页·Zbl 1280.91148号
[31] Gyurko,LG;汉堡,BM;Witte,JH,《通过对偶方法解决一些离散时间随机控制问题的蒙特卡罗方法》,运筹学数学方法,81,109-135(2015)·Zbl 1403.91372号
[32] Han,J。;Ee,W.,2016(2016),NIPS:随机控制问题的深度学习近似。NIPS深度强化学习研讨会
[33] 黄,YT;Kwok,YK,随机控制模型的基于回归的蒙特卡罗方法:终身保障的可变年金,Quant Finance,16905-928(2016)·Zbl 1468.91124号
[34] 胡雷,C。;Pham,H。;Bachouch,A。;Langrené,N.,有限水平随机控制问题的深度神经网络算法:收敛性分析,SIAM J Numer Ana,59,525-557(2021)·Zbl 1466.65007号
[35] Kharroubi,I。;Langrené,北卡罗来纳州。;Pham,H.,《完全非线性HJB方程的数值算法:通过控制随机化的方法》,Monte Carlo Methods Appl,20,145-165(2014)·Zbl 1294.60085号
[36] Lokka A,Xu J(2020)Almgren-Chris模型的最优清算轨迹。Int J Theo Appl Fin第23页。doi:10.1142/S0219024920500491·Zbl 1459.91177号
[37] Longstaff,F。;Schwartz,E.,《通过模拟评估美国期权:简单最小二乘法》,《金融研究评论》,第14期,第113-147页(2001年)·兹比尔1386.91144
[38] 马尔兹班,S。;Delage,E。;Li,JYM,《采用凸风险度量的金融衍生品的等风险定价和套期保值》,《定量金融》,22,1-27(2021)·Zbl 1484.91485号
[39] Nevmyvaka Y、Feng Y、Kearns M(2006)《优化贸易执行的强化学习》。第23届机器学习国际会议记录673-680
[40] 奥比沙耶娃,A。;Wang,J.,《最优贸易战略与供需动态》,《金融市场杂志》,第16期,第1-32页(2013年)
[41] Sadoghi,A。;Vecer,J.,非流动市场中的最优清算问题,《欧洲运筹学杂志》,2961050-1066(2022)·Zbl 1490.91192号
[42] Schied,A。;Schöneborn,T.,《风险规避与非流动市场中最优清算策略的动态》,《金融与随机》,第13期,第181-204页(2009年)·Zbl 1199.91190号
[43] Sirignano,J.,《限额订单书深度学习》,《定量金融》,19549-570(2019)·Zbl 1420.91555
[44] Stentoft,L.,《美国期权估值最小二乘蒙特卡罗法的收敛性》,《管理科学》,50,9,1193-1203(2004)·Zbl 1080.91041号
[45] Sutton,RS,《通过时间差异方法学习预测》,机器学习,3,9-44(1988)
[46] Tamar A,Chow Y,Ghavamzadeh M,Mannor S(2015)连贯风险度量的政策梯度。第28届神经信息处理系统国际会议记录:1468-1476
[47] Tesauro,G.,《时间差异学习中的实际问题》,机器学习,8257-277(1992)·Zbl 0772.68075号
[48] Tsitsiklis,JN,异步随机逼近和Q-Learning,机器学习,16,185-202(1994)·Zbl 0820.68105号
[49] JN齐齐克利斯;Van Roy,B.,《复杂美国式期权定价的回归方法》,IEEE Trans Neural Netw,12694-703(2001)
[50] 沃特金斯,C。;Dayan,P.,Q学习,机器学习,8279-292(1992)·Zbl 0773.68062号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。