阿吉姆·乌丁;陶新元;周嘉庆;于丹彤 缺失值对盈利预测重要吗?机器学习视角。 (英语) Zbl 1491.91162号 数量。财务 22,第6期,1113-1132(2022). 摘要:分析师的预测是对公司未来收益最常见和最重要的估计之一。然而,由于缺少值,它们很难充分利用。本研究应用机器学习技术估计个别分析师预测中的缺失值,然后根据估计和观察到的预测预测公司的未来收益。在估计缺失值后,预测误差比平均预测减少了41%,这表明估计后的缺失值确实对盈利预测有用。我们分析了多种估计方法,并表明矩阵分解(MF)的表现在使用不同评估方法和跨公司时是一致的。最后,我们提出了一种基于随机梯度下降的耦合矩阵分解(CMF),以提高多个数据集缺失值的估计质量。与使用单一数据集的MF相比,CMF进一步将收益预测误差减少了19%。 MSC公司: 91G50型 公司财务(股息、实物期权等) 68T05型 人工智能中的学习和自适应系统 关键词:分析师盈利预测;公司盈利预测;机器学习;耦合矩阵分解;缺失值估计 软件:XGBoost公司;凯拉斯;老鼠;插补 PDF格式BibTeX公司 XML格式引用 \textit{A.Uddin}等人,数量。财务22,No.6,1113--1132(2022;Zbl 1491.91162) 全文: 内政部 链接 参考文献: [1] Aberger,C.R.,《推荐:协同过滤技术分析》。斯坦福大学,2014年。 [2] Acar,E.、Gürdeniz,G.、Rasmussen,M.A.、Rago,D.、Dragsted,L.O.和Bro,R.,将矩阵分解与稀疏因子耦合,以确定代谢组学中的潜在生物标记物。2012年IEEE第12届国际数据挖掘研讨会会议记录,比利时布鲁塞尔,第1-8页,2012年。 [3] Almutairi,F.M。;新墨西哥州西迪罗普洛斯。;Karypis,G.,使用张量和耦合矩阵分解的基于上下文软件推荐的学习分析,IEEE J.Sel。顶部。信号处理。,11, 729-741 (2017) [4] 变更,O。;布朗,P.O。;Botstein,D.,用于全基因组表达数据处理和建模的奇异值分解,Proc。美国国家科学院。科学。,97, 10101-10106 (2000) [5] Anderson,T.W.,《多元统计分析导论》。技术报告,1962年(威利:纽约)。 [6] 艾尔斯,D。;黄,X.S。;Myring,M.,《公允价值会计和分析师预测准确性》,Adv.Account。,37, 58-70 (2017) [7] 球,R.T。;Ghysels,E.,《自动化盈利预测:击败分析师还是联合征服?》?,管理。科学。,64, 4936-4952 (2017) [8] 球,R.T。;Ghysels,E.,《自动盈利预测:击败分析师还是合并并征服?》?,管理。科学。,64, 4936-4952 (2018) [9] 巴蒂斯塔,G.E。;Monard,M.C.,《监督学习中四种缺失数据处理方法的分析》,应用。Artif公司。整数。,17, 519-533 (2003) [10] Bobadilla,J。;奥尔特加,F。;埃尔南多,A。;Bernal,J.,缓解新用户冷启动问题的协作过滤方法,Knowl。基于系统。,26, 225-238 (2012) [11] Bradley,D。;Gokkaya,S。;Liu,X.,在分析师成为分析师之前:行业经验重要吗?,《金融杂志》,72,751-792(2017) [12] M.T.Bradshaw,分析家预测:经过几十年的工作,我们知道了什么?2011年SSRN 1880339上提供。 [13] M.T.Bradshaw。;Drake,M.S。;迈尔斯,J.N。;迈尔斯,洛杉矶,《重新审视分析师对年度收益时间序列预测的优势》,Rev.Account。螺柱,17944-968(2012) [14] Brown,L.D。;哈格曼,R.L。;格里芬,P.A。;Zmijewski,M.E.,证券分析师在预测季度收益时相对于单变量时间序列模型的优势,J.Account。经济。,9, 61-87 (1987) [15] Buuren,S.V。;Groothuis-Audshoorn,K.,《小鼠:通过R,J.Stat.Softw中的链式方程进行多元插补》。,45, 1-68 (2011) [16] 坎迪斯,E.J。;Recht,B.,通过凸优化实现精确矩阵补全,Found。计算。数学。,9, 717 (2009) ·Zbl 1219.90124号 [17] 陈,S。;Matsumoto,D.A.,《有利与不利建议:对分析师获取管理层提供的信息的影响》,J.Account。Res.,44,657-689(2006) [18] Chen,T.和Guestrin,C.,Xgboost:一个可扩展的树木提升系统。《第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集》,美国加利福尼亚州旧金山,第785-794页,2016年。 [19] Cheng,C.H。;Chan,C.P。;Sheu,Y.J.,一种新的基于纯度的k近邻插补方法及其在财务困境预测中的应用,工程应用。Artif公司。整数。,81, 283-299 (2019) [20] Cho,K.和Reyhani,N.,含噪不完全矩阵奇异值分解的迭代算法。2012年国际神经网络联合会议(IJCNN)会议记录,澳大利亚昆士兰州布里斯班,第1-6页。 [21] Cholet,F.等人,Keras。https://keras.io网站,2015年。 [22] Clement,M.B.,分析师预测准确性:能力、资源和投资组合复杂性重要吗?,J.账户。经济。,27, 285-303 (1999) [23] 克莱门特,M.B。;Tse,S.Y.,投资者是否会对分析师的预测修正做出反应,就好像预测准确性才是最重要的?,账户。修订版,78227-249(2003) [24] 达斯,S。;莱文,C.B。;Sivaramakrishnan,K.,《分析师盈利预测中的盈利可预测性和偏差》,Account。修订版,73,277-294(1998) [25] 达塔,S。;Misra,D。;Das,S.,一种基于特征加权惩罚的差异性度量,用于缺失特征的k近邻分类,模式识别。莱特。,80, 231-237 (2016) [26] Donders,A.R.T。;Van Der Heijden,G.J。;Stijnen,T。;Moons,K.G.,《缺失值插补的温和介绍》,J.Clin。流行病。,59, 1087-1091 (2006) [27] Drucker,H.、Burges,C.J.、Kaufman,L.、Smola,A.J.和Vapnik,V.,支持向量回归机。《神经信息处理系统进展论文集》,科罗拉多州丹佛市,第155-1611997页。 [28] 伊斯特伍德,J.C。;Nutt,S.R.,《分析师盈利预测效率低下:系统性错误反应还是系统性乐观?》?,《金融杂志》,54,1777-1797(1999) [29] Fama,E.F。;French,K.R.,《盈利能力、投资和平均回报》,J.Financ。经济。,82, 491-518 (2006) [30] García-Laencina,P.J。;Sancho-Gómez,J.L。;Figueiras-Vidal,A.R。;Verleysen,M.,K同时分类和缺失数据插补的互信息最近邻,神经计算,721483-1493(2009) [31] Gemulla,R.,Nijkamp,E.,Haas,P.J.和Sismanis,Y.,《具有分布随机梯度下降的大尺度矩阵因式分解》。第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集,美国加利福尼亚州圣地亚哥,2011年,第69-77页。 [32] Graham,J.W.,《缺失数据分析:在现实世界中发挥作用》,Annu。精神病学牧师。,60, 549-576 (2009) [33] Hou,K。;Van Dijk,医学硕士。;Zhang,Y.,《隐含资本成本:一种新方法》,J.Account。经济。,53504-526(2012年) [34] 杰姆·R。;约翰斯顿,R。;马尔科夫,S。;Wolfe,M.C.,众包盈利预测的价值,J.Account。决议,54,1077-1110(2016) [35] Kang,H.,缺失数据的预防和处理,韩国麻醉杂志。,64, 402 (2013) [36] Koren,Y。;贝尔·R。;Volinsky,C.,推荐系统的矩阵分解技术,计算机,30-37(2009) [37] 科塔里,S.P。;所以,E。;Verdi,R.,《分析师预测与资产定价:一项调查》,《年度》。财务版次。经济。,8, 197-219 (2016) [38] 利卡,B。;Kolomvatsos,K。;Hadjiefthymiades,S.,《面对推荐系统中的冷启动问题》,专家系统。申请。,41, 2065-2073 (2014) [39] 马,W。;Chen,G.H.,《矩阵补全中的非随机缺失:在低核范数假设下估计缺失概率的有效性》,高级神经信息处理。系统。,32, 14900-14909 (2019) [40] O'Brien,P.C.,《九个行业的个别分析师的预测准确性》,J.Account。Res.,28,286-304(1990) [41] Provost,F。;Fawcett,T.,第五章:过度拟合及其规避,《商业数据科学:关于数据挖掘和数据分析思维的需要了解的内容》(2013),O'Reilly Media,Inc.:加利福尼亚州塞巴斯托波尔 [42] Ramnath,S。;洛克,S。;Shane,P.,《金融分析师预测文献:分类与进一步研究建议》,《国际预测杂志》。,24, 34-75 (2008) [43] Rubin,D.B.,《调查中无应答的多重插补》,第81卷(2004年),John Wiley&Sons:Hoboken,NJ·2007年6月10日 [44] 辛哈,P。;Brown,L.D。;Das,S.,《重新检查财务分析师的差异收益预测准确性》,康特姆。账户。决议,14,1-42(1997) [45] Tibshirani,R.,通过套索进行回归收缩和选择,J.R.Stat.Soc.:Ser。B、 58、267-288(1996)·Zbl 0850.62538号 [46] 俄勒冈州特罗扬斯卡娅。;康托,M。;Sherlock,G。;布朗,P。;哈斯蒂,T。;Tibshirani,R。;Botstein博士。;Altman,R.B.,DNA微阵列缺失值估计方法,生物信息学,17,520-525(2001) [47] A.乌丁。;Yu,D.,资产定价的潜在因素模型,J.Behav。财政支出,27(2020) [48] Van Loan,C.F。;Golub,G.H.,《矩阵计算》(1983),约翰霍普金斯大学出版社:马里兰州巴尔的摩·Zbl 0559.65011号 此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。