×

大数据集和机器学习:统计套利的应用。 (英语) Zbl 1414.91435号

概要:机器学习算法和大数据正在改变包括金融和投资组合管理部门在内的所有行业。虽然这些技术,如深度信念网络或随机森林,在市场上越来越流行,但学术文献相对较少。通过一系列涉及数百个变量/预测因子和股票的应用程序,本文介绍了一些最先进的技术,以及如何实现这些技术来管理长短投资组合。提出了许多实际和经验问题。大数据使用之外的主要问题之一是信息的价值。预测因子数量的增加是否会提高投资组合绩效?哪些功能最重要?大量的预测因素可能意味着高水平的噪声。算法是如何管理这一点的?本文使用22年的交易期、多达300个美国大盘股和大约600个预测因子开发了一个应用程序。实证结果表明,这些技术能够为具有重要周转率和短持有期(一天或五天)的投资组合生成有用的交易信号。1993年至2008年间报告了正超额回报。在考虑了交易成本和传统风险因素后,它们会大幅减少。当这些机器学习工具在市场上现成可用时,超额回报在最近几年变成了负值。结果还表明,添加功能远不能保证提高投资组合的alpha。

MSC公司:

91G80型 其他理论的金融应用
62-07 数据分析(统计)(MSC2010)
62P05号 统计学在精算学和金融数学中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ariel,R.A.,《节前高股票回报:可能原因的存在和证据》,《金融杂志》,45,5,1611-1626(1990)
[2] Atsalakis,G.S。;Valavanis,K.P.,《股市预测技术调查——第二部分:软计算方法》,《应用专家系统》,36,3,5932-5941(2009)
[3] Avellaneda,M。;Lee,J.-H.,《美国股市的统计套利》,《定量金融》,2010年第10期,第7期,第761-782页·Zbl 1194.91196号
[4] 巴布,N。;樱井,Y.,《利用宏观经济变量预测波动率指数中的制度转换》,《应用经济快报》,第18期,第13-15期,第1415-1419页(2011年)
[5] Baesens,B。;巴普纳,R。;马斯登,J.R。;Vantheinen,J。;Zhao,J.L.,《网络业务中大数据和分析的转型问题》,MIS Quarterly,40,4,807-818(2016)
[6] Bahramirzaee,A.,《人工智能在金融中的应用比较调查:人工神经网络、专家系统和混合智能系统》,《神经计算与应用》,19,8,1165-1195(2010)
[7] Bai,J。;范,J。;Tsay,R.,大数据专刊,《商业与经济统计杂志》,34,4,487-488(2016)
[8] Baldi,P.,《自动编码器、无监督学习和深度架构》,(Guyon,I.;Dror,G.;Lemaire,V.;Taylor,G.;Silver,D.,无监督和迁移学习icml研讨会论文集。无监督和迁移学习icml研讨会论文集,机器学习研究论文集,27(2012),PMLR:PMLR Bellevue,美国华盛顿),37-49
[9] Bao,W。;Yue,J。;Rao,Y.,《使用堆叠自动编码器和长短记忆的金融时间序列深度学习框架》,Plos One,12,7(2017)
[10] Baron,J。;Mellers,B.A。;泰特洛克,体育。;斯通,E。;Ungar,L.H.,使综合概率预测更加极端的两个原因,决策分析,11,2133-145(2014)·Zbl 1398.90060号
[11] Bengio,Y.,《学习人工智能的深层架构,机器学习的基础和趋势》,2,1,1-127(2009)·Zbl 1192.68503号
[12] 布莱克,A.J。;俄亥俄州克林科夫斯卡。;McMillan,D.G。;McMillan,F.J.,《预测股票回报:商品价格有帮助吗?》?,《预测杂志》,33,8,627-639(2014)
[13] Blake,M.,《大数据智能技术》,《贸易杂志》,9,1,57-66(2014)
[14] Breiman,L.,《随机森林,机器学习》,45,1,5-32(2001)·Zbl 1007.68152号
[15] Caliskan,D。;Najand,M.,《股票市场回报与黄金价格》,《资产管理杂志》,17,1,10-21(2016)
[16] Carhart,M.M.,《论共同基金业绩的持续性》,《金融杂志》,52,1,57(1997)
[17] 陈,H。;Chiang,R.H.L。;Storey,V.C.,《商业智能和分析:从大数据到大影响》,MIS Quarterly,36,4,1165-1188(2012)
[18] 陈,Z。;Knez,P.,《投资组合绩效衡量:理论与应用》,《金融研究评论》,9,2,511(1996)
[19] Chong,E。;Han,C。;Park,F.C.,《股票市场分析和预测的深度学习网络:方法、数据表示和案例研究》,《应用专家系统》,83,187-205(2017)
[20] Chordia,T。;滚转,R。;Subrahmanyam,A.,《交易活动和市场质量的近期趋势》,《金融经济学杂志》,第101、2、243-263页(2011年)
[21] 克里斯托弗森,P.F。;Diebold,F.X.,《金融资产回报、方向变化预测和波动动力学》,《管理科学》,52,8,1273-1287(2006)
[22] 科普兰,M.M。;Copeland,T.E.,《市场时机:使用VIX进行风格和规模轮换》,《金融分析师杂志》,55,2,73-81(1999)
[23] 科珀史密斯,D。;Hong,S.J。;Hosking,J.R.,决策树中的标称属性划分,数据挖掘和知识发现,3,2,197-217(1999)
[24] Cybenko,G.,通过sigmoid函数的叠加进行逼近,控制、信号和系统数学(MCSS),2,4,303-314(1989)·Zbl 0679.94019号
[25] 德米格尔,V。;加拉皮,L。;Uppal,R.,《最优多元化与天真多元化:1/n投资组合策略的效率有多低?》?,《金融研究评论》,第22期,第5期,1915-1953年(2009年)
[26] 邓,Y。;Bao,F。;孔,Y。;任,Z。;Dai,Q.,金融信号表示和交易的深度直接强化学习,IEEE神经网络与学习系统交易,28,3,653-664(2017)
[27] Dhar,V.,深度学习的范围和挑战,大数据,3,3,127-129(2015)
[28] Dhar,V.,《你应该把钱托付给机器人吗?大数据》,3,2,55-58(2015)
[29] Dietterich,T.G.,机器学习中的集成方法,多分类器系统,1-15(2000),Springer
[30] 恩克博士。;Thawornwong,S.,《使用数据挖掘和神经网络预测股市收益》,《应用专家系统》,29,4,927-940(2005)
[31] Fama,E.F。;French,K.R.,《股票和债券回报中的常见风险因素》,《金融经济学杂志》,33,1,3-56(1993)·Zbl 1131.91335号
[32] 范,J。;Han,F。;刘浩,大数据分析的挑战,《国家科学评论》,2014年第1期,第2期,第293-314页
[33] 费尔南德斯,M。;Medeiros,M.C。;Scharth,M.,《CBOE市场波动指数建模与预测》,《银行与金融杂志》,第40期,第1-10页(2014年)
[34] Ferson,W.E。;Schadt,R.W.,《在不断变化的经济条件下衡量基金战略和绩效》,《金融杂志》,51,2,425-461(1996)
[35] Fischer,T。;Krauss,C.,《利用长短期记忆网络进行金融市场预测的深度学习》,《欧洲运筹学杂志》,270,2,654-669(2018)·兹比尔1403.91387
[36] 弗莱明,J。;柯比,C。;Ostdiek,B.,波动时间的经济价值,《金融杂志》,56,1,329-352(2001)
[37] Genuer,R.、Poggi,J.-M.、Tuleau-Malot,C.和Villa-Vialaneix,N.(2017年)。大数据的随机森林。大数据研究,(9)https://hal.archives-ouvertes.fr/hal-01233923; Genuer,R.、Poggi,J.-M.、Tuleau-Malot,C.和Villa-Vialaneix,N.(2017年)。大数据的随机森林。大数据研究,(9)https://hal.archives-ouvertes.fr/hal-01233923
[38] 乔治·G。;哈斯,M.R。;Pentland,A.,《大数据与管理》,《管理学会期刊》,57,2,321-326(2014)
[39] 乔治·G。;Osinga,E.C。;拉维,D。;Scott,B.A.,《管理研究的大数据和数据科学方法》,《管理学会期刊》,59,5,1493-1507(2016)
[40] Gibbons,M.R。;Hess,P.,《周内效应和资产回报》,《商业杂志》,54,4,579-596(1981)
[41] Grushka-Cockayne,Y。;Jose,V.R.R。;Lichtendahl,K.C.,《过度自信和过度自信预测的集合》,《管理科学》,63,4,1110-1130(2017)
[42] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素》,《统计学中的斯普林格系列》(2001),斯普林格纽约公司:斯普林格美国纽约州纽约市·Zbl 0973.62007号
[43] 希顿,J.B。;新几内亚波尔森。;Witte,J.H.,《金融深度学习:深度投资组合》,SSRN(2016)·Zbl 1420.91415号
[44] Hinton,G.E.,《深度信仰网络》,《学者传媒》,第4、5、5947页(2009年)
[45] 辛顿,G.E。;Osindero,S。;Teh,Y.-W.,深度信念网络的快速学习算法,神经计算,18,7,1527-1554(2006)·Zbl 1106.68094号
[46] 辛顿,G.E。;Salakhuttinov,R.R.,用神经网络降低数据的维数,科学,313504-507(2006)·Zbl 1226.68083号
[47] 霍尔,A.E。;Kennard,R.W.,《岭回归:非正交问题的有偏估计》,技术计量学,12,1,55-67(1970)·兹伯利0202.17205
[48] 洪,H。;托鲁斯,W。;Valkanov,R.,《产业是否引领股市?》?,《金融经济学杂志》,83,2367-396(2007)
[49] 霍尼克,K。;Stinchcombe先生。;White,H.,多层网络是通用逼近器,神经网络,2,5,359-366(1989)·Zbl 1383.92015年
[50] 徐明伟。;莱斯曼,S。;宋,M.-C。;Ma,T.,《弥合金融市场预测的鸿沟:机器学习者与金融经济学家》,《应用专家系统》,第61期,第215-234页(2016年)
[51] 黄,W。;莫利克,A.V。;Nguyen,K.H.,《美国股市和实际利率的作用》,《经济与金融季报》,59,231-242(2016)
[52] 哈克,N.,Pairs selection and outranking:An application to the S&P 100 index,European Journal of Operational Research,196,2819-825(2009)
[53] 哈克,N.,Pairs trading and outranking:The multi-step-head forecasting case,European Journal of Operational Research,207,31702-1716(2010)
[54] Jacobs,H.,如何解释100个异常的动态?,《银行与金融杂志》,57,65-85(2015)
[55] 詹姆斯·G·M。;维滕,D。;哈斯蒂,T。;Tibshirani,R.,《统计学习导论:在R中的应用》,Springer texts in statistics(2014),Springer:Springer New York
[56] Jegadeesh,N.,《证券收益可预测行为的证据》,《金融杂志》,45,3,881(1990)
[57] Jensen,M.C.,《1945-1964年期间共同基金的表现》,《金融杂志》,23389-416(1968)
[58] 加奇,C。;Tindall,M.L.,使用收缩方法进行对冲基金复制,《另类投资杂志》,17,2,26-49(2014)
[59] 琼斯,C.M。;Kaul,G.,《石油和股票市场》,《金融杂志》,51,2,463-491(1996)
[60] 基里安,L。;Park,C.,《油价冲击对美国股市的影响》,《国际经济评论》,50,4,1267-1287(2009)
[61] 克劳斯,C。;Do,X.A。;哈克,N.,《深层神经网络、梯度增强树、随机森林:标准普尔500指数的统计套利》,《欧洲运筹学杂志》,259,2,689-702(2017)·Zbl 1395.91514号
[62] 科里姆,S。;Scholz,H。;Wilkens,M.,《夏普比率的市场气候偏差:来自美国股票共同基金的理论和经验证据》,《资产管理杂志》,第13、4、227-242页(2012年)
[63] Kwan,M.,《大数据对贸易和技术的影响》,《贸易杂志》,9,1,54-56(2014)
[64] Laopodis,N.T.,货币政策和股票市场动态,《国际货币与金融杂志》,33,381-406(2013)
[65] Leung,M.T。;Daouk,H。;Chen,A.-S.,《预测股票指数:分类和水平估计模型的比较》,《国际预测杂志》,16,2,173-190(2000)
[66] 李毅。;蒋伟(Jiang,W.)。;Yang,L。;Wu,T.,《关于商业计算的神经网络和学习系统》,神经计算,2751150-1159(2018)
[67] Lichtendahl,K.、Yael,G.-C.、Victor Richmond R.,J.和Robert L.,W.(2018年)。二进制事件预测的贝叶斯集合:什么时候适合极端化或反极端化?工作文件19035。arXiv:1705.02391v2;Lichtendahl,K.、Yael,G.-C.、Victor Richmond R.,J.和Robert L.,W.(2018年)。二元事件预测的贝叶斯集合:什么时候适合极端化或反极端化?工作文件19035。arXiv:1705.02391v2
[68] Lo,A.W.,适应性市场假说,《投资组合管理杂志》,30,5,15-29(2004)
[69] Lo,A.W.,《对冲基金:分析视角》,《金融工程进展》(2010),普林斯顿大学出版社:普林斯顿大学出版·兹比尔1198.91001
[70] Longin,F。;Solnik,B.,《国际股票市场的极端相关性》,《金融杂志》,56,2,649-676(2001)
[71] Maasoumi,E。;Medeiros,M.C.,《统计学习理论与计量经济学之间的联系:在经济学、金融学和市场营销中的应用》,《计量经济学评论》,29,5/6,470-475(2010)
[72] 曼伊卡,J。;Chui,M。;布朗,B。;Bughin,J。;多布斯,R。;罗克斯堡,C。;Hung Byers,A.,《大数据:创新、竞争和生产力的下一个前沿》(2011年),麦肯锡全球研究所
[73] Moritz,B.和Zimmermann,T.(2014)。深度条件投资组合分类:过去和未来股票回报之间的关系。工作文件。;Moritz,B.和Zimmermann,T.(2014)。深度条件投资组合分类:过去和未来股票回报之间的关系。工作文件。
[74] Mullainathan,S。;Spiess,J.,《机器学习:应用计量经济学方法》,《经济展望杂志》,31,2,87-106(2017)
[75] O'Hara,M.,《高频交易及其对市场的影响》,《金融分析师杂志》,第70、3、18-27页(2014年)
[76] Panopoulou,E。;Plastira,S.,Fama-french因子与美国股票回报可预测性,《资产管理杂志》,第15、2、110-128页(2014年)
[77] Panopoulou,E。;Vrontos,S.,对冲基金收益可预测性;合并预测或合并信息?,《银行与金融杂志》,56,103-122(2015)
[78] Rumelhart,D.E。;辛顿,G.E。;Williams,R.J.,《并行分布处理:认知微观结构的探索》,《通过错误传播学习内部表征》,1318-362(1986),麻省理工学院出版社:麻省理工大剑桥出版社,美国
[79] Sadka,R.,《流动性风险与对冲基金回报的横截面》,《金融经济学杂志》,98,1,54-71(2010)
[80] 萨托帕,V.A。;佩曼特尔,R。;Ungar,L.H.,《通过信息多样性进行概率预测建模》,《美国统计协会杂志》,1115161623-1633(2016)
[81] Scholz,H.,《优化夏普比率:比较熊市的替代方案》,《资产管理杂志》,第7、5、347-357页(2007年)
[82] Scornet,E。;Biau,G。;Vert,J.-P.,《随机森林的一致性》,《统计年鉴》,43,4,1716-1741(2015)·Zbl 1317.62028号
[83] Scott,C.,与robert Littleman的对话,《投资组合管理杂志》,57-63(2014)
[84] 塞顿,J.J。;Currie,W.L.,《高频交易中大数据分析解包模型》,《商业研究杂志》,70,300-307(2017)
[85] 夏普,W.F.,《夏普比率》,《投资组合管理杂志》,21,1,49(1994)
[86] 西尔弗·D。;黄,A。;Maddison,C.J。;A.盖兹。;Sifre,L。;van den Driessche,G.,《掌握深度神经网络和树搜索的游戏》,《自然》,529,484-489(2016)
[87] 西尔弗·D。;施里特维泽,J。;Simonyan,K。;安东尼奥卢,I。;黄,A。;Guez,A.,《在没有人类知识的情况下掌握围棋游戏》,《自然》,550,354-359(2017)
[88] 斯普雷克尔森,C。;梅滕海姆,H.-J。;Breitner,M.H.,人工神经网络对货币期货期权的实时定价和套期保值,预测杂志,33,6419-432(2014)·Zbl 1397.91580号
[89] 塔迪,M。;加德纳,M。;Chen,L。;Draper,D.,《数字实验中异质治疗效应的非参数贝叶斯分析》,《商业与经济统计杂志》,34,4,661-672(2016)
[90] Takeuchi,L.和Lee,Y.-Y.A.(2013)。运用深度学习提高股票动量交易策略。斯坦福大学工作文件。;Takeuchi,L.和Lee,Y.-Y.A.(2013)。运用深度学习提高股票动量交易策略。工作文件,斯坦福大学。
[91] 《经济学人》(2016)。改变游戏规则的结果。http://www.economist.com/news/science-and-technology/21694883-alphagos-masters-taught-it-game-electrifying-match-shows-what; 《经济学人》(2016)。改变游戏规则的结果。http://www.economist.com/news/science-and-technology/21694883-alphagos-masters-taught-it-game-electrifying-match-shows-what
[92] Tibshirani,R.,《通过套索进行回归收缩和选择》,《皇家统计学会杂志:B辑(统计方法)》,58,1,267-288(1996)·Zbl 0850.62538号
[93] Troiano,L。;维拉,E.M。;Loia,V.,《利用LSTM复制金融行业应用的交易策略》,IEEE工业信息学汇刊,14,7,3226-3234(2018)
[94] 瓦里安,H.R.,《大数据:计量经济学的新技巧》,《经济展望杂志》,28,2,3-28(2014)
[95] Verikas,A。;Gelzinis,A。;Bacauskiene,M.,《随机森林的挖掘数据:调查和新测试结果》,模式识别,44,2,330-349(2011)
[96] Whaley,R.E.,《投资者恐惧指数》,《投资组合管理杂志》,第26、3、12-17页(2000年)
[97] Wong,B。;Selvi,Y.,《金融中的神经网络应用:文献回顾与分析》(1990年至1996年),《信息与管理》,第34、3、129-139页(1998年)
[98] Zhao,Y。;李,J。;Yu,L.,《原油价格预测的深度学习集成方法》,《能源经济》,9-16(2017)
[99] 齐格勒,A。;Knig,I.R.,《用随机森林挖掘数据:现实世界应用的当前选项》,威利跨学科评论:数据挖掘和知识发现,4,1,55-63(2014)
[100] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,《皇家统计学会杂志:B辑(统计方法)》,67,2,301-320(2005)·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。