文件Zbl 1518.91265-zbMATH Open

通过限价订单进行最优清算：一种神经网络和模拟方法。（英语）兹比尔1518.91265

Methodol公司。计算。申请。普罗巴伯。 25，第1号，第3号论文，29页（2023年）。

摘要：我们提出了一种基于仿真和神经网络的学习算法，用于使用动态规划解决具有大状态空间的随机最优控制问题。问题在于通过限额订单（LOB）清算给定数量的股票。状态空间包括LOB中每个级别的价格和数量。目标是使预期清算收益最大化。股票通过与LOB中的当前限额订单相匹配的市场订单出售，并对LOB的未来演变产生影响。采用基于神经网络的性能和值迭代过程的混合形式获得最优策略。通过深度学习分类任务估计LOB的概率分布。该模型在通过纽约证券交易所Arcbook交易的12只股票上进行了测试，数值实现表明，该模型在很大程度上优于文献中最常见的最优清算模型。

MSC公司：

91G15型	金融市场
93年20日	最优随机控制
49升20	最优控制与微分对策中的动态规划

关键词：

随机控制问题;最优清算;限额订单簿;神经网络

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Ackermann，J。；Kruse，T。；乌鲁索夫，M.，随机订单模型中最优贸易执行的Cádlág半鞅策略，金融与随机，25757-810（2021）·Zbl 1476.91166号
[2]	北阿巴扎德。；Tekin，C。；Van der Schaar，M.，《限额订单交易执行中的在线学习》，IEEE Trans Signal Process，66，4626-4641（2018）·Zbl 1414.68041号
[3]	阿方西，A。；水果，A。；Schied，A.，《具有一般形状函数的极限订单簿中的最优执行策略》，《定量金融》，2010年第10期，第143-157页·Zbl 1185.91199号
[4]	Almgren，R.，《随机流动性和波动性的最优交易》，SIAM J Finance Math，3163-181（2012）·Zbl 1256.49031号
[5]	Almgren R，Chriss N（1999），清算中的价值。风险1999年12月
[6]	Bachouch，A。；胡雷，C。；Pham，H。；Langrené，N.，有限水平随机控制问题的深度神经网络算法：数值计算，Methodol Comput Appl Prob，24，143-178（2022）·Zbl 1496.93112号
[7]	Barrera-Esteve，C。；Bergeret，F。；剂量，C。；戈贝，E。；Meziou，A。；穆诺斯，R。；Reboul Salze，D.，波动期权定价的数值方法：随机控制方法，Methodol Comput Appl Prob，8517-540（2006）·Zbl 1142.91502号
[8]	Bayraktar，E。；Ludkovski，M.，《强度可控的限额指令簿中的清算》，《数学金融》，24，627-650（2014）·Zbl 1314.91247号
[9]	Becherer，D。；Bilarev，T。；Frentrup，P.，《随机流动性下的最优清算》，《金融与随机》，22，39-68（2018）·Zbl 1391.91164号
[10]	Belomestny，D。；哈夫纳，S。；Urusov，M.，基于回归的嵌套蒙特卡罗方法复杂性降低，SIAM金融数学杂志，9，665-689（2018）·Zbl 1415.91314号
[11]	Bertsekas D，Tsitsiklis J（1995）《神经动力学编程：概述》。1995年第34届IEEE决策与控制会议记录：560-564
[12]	Broadie M，Glasserman P，Ha Z（2000）使用具有优化权重的随机网格模拟美式期权定价。概率约束优化（第26-44页）。马萨诸塞州波士顿斯普林格·Zbl 1013.91054号
[13]	Buehler，H。；Gonon，L。；Teichmann，J.等人。；Wood，B.，《深度对冲》，Quant Finance，第19期，1271-1291页（2019年）·Zbl 1420.91450
[14]	Carbonneau，A。；Godin，F.，《深度对冲衍生工具的等风险定价》，广发金融，21593-608（2021）·Zbl 1476.91177号
[15]	卡莫纳，R。；Ludkovski，M.，《使用最优切换定价资产调度灵活性》，《应用数学金融》，第15期，第405-447页（2008年）·Zbl 1156.91361号
[16]	卡特亚，A。；Jaimungal，S.，《限额和市场订单的最优执行》，《Quant Finance》，第15期，1279-1291页（2015年）·Zbl 1406.91403号
[17]	卡特亚，A。；南加尔。；Penalva，J.，《算法与高频交易》（2015），剑桥大学出版社·Zbl 1332.91001号
[18]	卡特亚，A。；南加尔。；Ricci，J.，《低买高卖：高频交易视角》，SIAM金融数学期刊，5145-444（2014）·Zbl 1308.91199号
[19]	Cartea A、Jaimungal S、Sanchez-Betancourt L（2021）算法交易的深度强化学习。https://ssrn.com/abstract=3812473
[20]	Chevalier E，Ly Vath V，Roch A，Scotti S（2016）通过限价指令市场进行清算的最佳执行成本。国际西奥应用财务杂志19（1）。doi:10.1142/S021902491650047·Zbl 1337.91158号
[21]	续，R。；斯托科夫，S。；Talrej，R.，订单动态的随机模型，Oper Res，58，3，549-563（2010）·Zbl 1232.91719号
[22]	Denault，M。；Delage，E。；Simonato，J-G，《动态投资组合选择：模拟与回归方法》，Optim Eng，18，369-406（2017）·Zbl 1370.90306号
[23]	Denault，M。；Simonato，J-G，《通过模拟和回归进行动态投资组合选择：重新审视价值函数与投资组合权重递归的问题》，《Comp Oper Res》，79，174-189（2017）·Zbl 1395.91400号
[24]	Denault，M。；西蒙纳托，J-G；Stentoft，L.，带有内生状态变量的随机动态程序的模拟和回归方法，Comp Oper Res，402760-2769（2013）·Zbl 1348.90617号
[25]	埃格洛夫，D。；科勒，M。；Todorovic，N.，《百慕大期权定价的动态look-ahead Monte Carlo算法》，《Ann Appl Probab》，第17期，第1138-1171页（2007年）·Zbl 1136.91010号
[26]	Germain M，Pham H，Warin X（2021）基于神经网络的随机控制算法和金融PDE。doi:10.48550/arXiv.2101.08068·兹伯利07341723
[27]	Glasserman，P。；Yu，B。；尼德雷特，H.，《美国期权模拟：现在回归还是以后回归？》？，蒙特卡罗和准蒙特卡罗方法2002（2004），海德堡：施普林格，柏林，海德伯格·Zbl 1062.91033号
[28]	盖恩特，O。；Lehalle，C.，《最优清算中的一般强度形状》，《数学金融》，25，457-495（2015）·Zbl 1331.91165号
[29]	盖恩特，O。；Lehalle，C.公司。；Tapia，J.，《限额指令下的最优投资组合清算》，SIAM J Finan Math，3740-764（2011）·Zbl 1262.91160号
[30]	吉尔鲍德，F。；Pham，H.，《限制和市场订单的最佳高频交易》，《Quant Finance》，2013年第13期，第79-94页·Zbl 1280.91148号
[31]	Gyurko，LG；汉堡，BM；Witte，JH，《通过对偶方法解决一些离散时间随机控制问题的蒙特卡罗方法》，运筹学数学方法，81，109-135（2015）·Zbl 1403.91372号
[32]	Han，J。；Ee，W.，2016（2016），NIPS：随机控制问题的深度学习近似。NIPS深度强化学习研讨会
[33]	黄，YT；Kwok，YK，随机控制模型的基于回归的蒙特卡罗方法：终身保障的可变年金，Quant Finance，16905-928（2016）·Zbl 1468.91124号
[34]	胡雷，C。；Pham，H。；Bachouch，A。；Langrené，N.，有限水平随机控制问题的深度神经网络算法：收敛性分析，SIAM J Numer Ana，59，525-557（2021）·Zbl 1466.65007号
[35]	Kharroubi，I。；Langrené，北卡罗来纳州。；Pham，H.，《完全非线性HJB方程的数值算法：通过控制随机化的方法》，Monte Carlo Methods Appl，20，145-165（2014）·Zbl 1294.60085号
[36]	Lokka A，Xu J（2020）Almgren-Chris模型的最优清算轨迹。Int J Theo Appl Fin第23页。doi:10.1142/S0219024920500491·Zbl 1459.91177号
[37]	Longstaff，F。；Schwartz，E.，《通过模拟评估美国期权：简单最小二乘法》，《金融研究评论》，第14期，第113-147页（2001年）·兹比尔1386.91144
[38]	马尔兹班，S。；Delage，E。；Li，JYM，《采用凸风险度量的金融衍生品的等风险定价和套期保值》，《定量金融》，22，1-27（2021）·Zbl 1484.91485号
[39]	Nevmyvaka Y、Feng Y、Kearns M（2006）《优化贸易执行的强化学习》。第23届机器学习国际会议记录673-680
[40]	奥比沙耶娃，A。；Wang，J.，《最优贸易战略与供需动态》，《金融市场杂志》，第16期，第1-32页（2013年）
[41]	Sadoghi，A。；Vecer，J.，非流动市场中的最优清算问题，《欧洲运筹学杂志》，2961050-1066（2022）·Zbl 1490.91192号
[42]	Schied，A。；Schöneborn，T.，《风险规避与非流动市场中最优清算策略的动态》，《金融与随机》，第13期，第181-204页（2009年）·Zbl 1199.91190号
[43]	Sirignano，J.，《限额订单书深度学习》，《定量金融》，19549-570（2019）·Zbl 1420.91555
[44]	Stentoft，L.，《美国期权估值最小二乘蒙特卡罗法的收敛性》，《管理科学》，50，9，1193-1203（2004）·Zbl 1080.91041号
[45]	Sutton，RS，《通过时间差异方法学习预测》，机器学习，3，9-44（1988）
[46]	Tamar A，Chow Y，Ghavamzadeh M，Mannor S（2015）连贯风险度量的政策梯度。第28届神经信息处理系统国际会议记录：1468-1476
[47]	Tesauro，G.，《时间差异学习中的实际问题》，机器学习，8257-277（1992）·Zbl 0772.68075号
[48]	Tsitsiklis，JN，异步随机逼近和Q-Learning，机器学习，16，185-202（1994）·Zbl 0820.68105号
[49]	JN齐齐克利斯；Van Roy，B.，《复杂美国式期权定价的回归方法》，IEEE Trans Neural Netw，12694-703（2001）
[50]	沃特金斯，C。；Dayan，P.，Q学习，机器学习，8279-292（1992）·Zbl 0773.68062号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
作业成本法*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

通过限价订单进行最优清算：一种神经网络和模拟方法。（英语）兹比尔1518.91265

MSC公司：

关键词：

参考文献：

示例

领域

操作员

通过限价订单进行最优清算：一种神经网络和模拟方法。 （英语） 兹比尔1518.91265

MSC公司：

关键词：

参考文献：

通过限价订单进行最优清算：一种神经网络和模拟方法。（英语）兹比尔1518.91265