×

使用深度学习,使用文本网站内容扩展业务失败预测模型。 (英语) Zbl 07633837号

摘要:企业失败预测(BFP)是评估企业失败风险的重要工具。虽然大量的研究都集中在BFP上,但运筹学和分析学的最新研究承认,将文本数据纳入预测建模的有益效果。然而,结合公司文本信息的现有BFP研究非常稀少。基于欧洲最大的数据聚合商提供的包含13571家欧洲公司的数据集,本研究调查了使用文本网站内容扩展传统BFP模型的附加值。我们进一步对自然语言处理中的各种特征提取技术(即向量空间方法、基于神经网络的方法和变换器)进行了基准测试,并评估了表示和集成用于BFP建模的文本网站特征的最佳方法。结果证实,包含文本网站数据可以提高BFP预测性能,并且在这个基准设置中,由转换器提取的文本特征为BFP模型增加了最大的价值。

MSC公司:

900亿 运筹学与管理科学
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Z.艾哈迈迪。;Martens,P。;科赫,C。;Gottron,T。;Kramer,S.,走向破产预测:从企业管理报告中检测财务困境的深度情绪挖掘,Proceedings-2018 IEEE第五届数据科学和高级分析国际会议,DSAA 2018,293-302(2018),IEEE
[2] 奥尔波特,哥伦比亚特区。;Pendley,J.A.,《网站设计对互联网财务报告可信度的影响》,《会计、财务和管理智能系统》,第17期,第127-141页(2010年)
[3] Alpaydin,E.,用于比较监督分类学习算法的组合\(5\乘以2\)cv F检验,神经计算,11885-1892(1999)
[4] Antunes,F。;里贝罗,B。;Pereira,F.,破产预测的概率建模和可视化,应用软件计算,60,831-843(2017)
[5] Balcaen,S。;Ooghe,H.,《商业失败研究35年:经典统计方法及其相关问题概述》,《英国会计评论》,38,1,63-93(2006)
[6] 博伦,L。;哈森克,H。;Bozic,G.,《衡量和解释互联网投资者关系活动的质量:跨国实证分析》,《国际会计信息系统杂志》,第7期,第4期,第273-298页(2006年)
[7] 西葫芦,M。;Aytug,H。;Koehler,G.J。;Pathak,P.,《让文字发挥作用:使用金融文本预测金融事件》,《决策支持系统》,50,1,164-175(2010)
[8] Chawla,N.V.,《不平衡数据集的数据挖掘:概述》,《数据挖掘和知识发现手册》,875-886(2009),施普林格出版社
[9] 查拉,N.V。;鲍耶,K.W。;洛杉矶霍尔。;Kegelmeyer,W.P.,SMOTE:合成少数人过采样技术,《人工智能研究杂志》,16,321-357(2002)·Zbl 0994.68128号
[10] Chen,T。;Guestrin,C.,XGBoost:一个可扩展的树增强系统,第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集,785-794(2016)
[11] 库塞门特,K。;Van Den Poel,D.,《利用语言风格特征作为预测因子,通过自动电子邮件分类改进客户投诉管理》,《决策支持系统》,44870-882(2008)
[12] De Bock,K.W。;库塞门特,K。;Lessmann,S.,《错误分类成本不确定时的成本敏感商业失败预测:异质集合选择方法》,《欧洲运筹学杂志》,285,2,612-630(2020)·Zbl 1441.91085号
[13] De Caigny,A。;库塞门特,K。;De Bock,K.W.,基于逻辑回归和决策树的客户流失预测新混合分类算法,《欧洲运筹学杂志》,269760-772(2018)·Zbl 1388.90061号
[14] De Caigny,A。;库塞门特,K。;De Bock,K.W。;Lessmann,S.,基于卷积神经网络将文本信息纳入客户流失预测模型,《国际预测杂志》,36,4,1564-1578(2020)
[15] Deerwester,S.公司。;Dumais,S.T。;Furnas,G.W。;Landauer,T.K。;Harshman,R.,《利用潜在语义分析进行索引》,《美国信息科学学会杂志》,41,6,391-407(1990)
[16] Devlin,J.、Chang,M.-W、Lee,K.和Toutanova,K.(2018)。BERT:用于语言理解的深度双向转换器的预训练。arXiv预打印arXiv:1810.04805v2。
[17] Dietterich,T.,比较监督分类学习算法的近似统计测试,神经计算,101895-1923(1998)
[18] 迪米特拉斯,A.I。;Zanakis,S.H。;Zopounidis,C.,《以预测方法和工业应用为重点的商业失败调查》,《欧洲运筹学杂志》,90,487-513(1996)·Zbl 0907.90038号
[19] Doumpos,M。;雄配子体,K。;Galariotis,E。;Makridou,G。;Zopounidis,C.,《欧洲能源部门的企业失败预测:多标准方法和国家特征的影响》,《欧洲运筹学杂志》,262347-360(2017)
[20] Du Jardin,P.,《利用终端失效过程进行破产预测》,《欧洲运筹学杂志》,242286-303(2015)·Zbl 1341.91134号
[21] Du Jardin,P.,使用双聚类和基于神经网络的集成预测破产,运筹学年鉴,1-36(2019)
[22] Fischer,T。;Krauss,C.,《利用长短期记忆网络进行金融市场预测的深度学习》,《欧洲运筹学杂志》,270654-669(2018)·Zbl 1403.91387号
[23] 弗拉奇,P。;Kull,M.,《精确-再调用-收益曲线:正确的Pr分析》(Cortes,C.;Lawrence,N.;Lee,D.;Sugiyama,M.;Garnett,R.,《神经信息处理系统的进展》(2015),Curran Associates,Inc.)
[24] Geerings,J。;Bollen,L.H。;Hassink,H.F.,《互联网上的投资者关系:泛欧交易所区域调查》,《欧洲会计评论》,第12、3、567-579页(2003年)
[25] Geng,R。;Bose,I。;Chen,X.,《财务困境预测:基于数据挖掘的中国上市公司实证研究》,《欧洲运筹学杂志》,241236-247(2015)
[26] 郭,B。;张,C。;刘杰。;Ma,X.,通过多通道TextCNN模型使用加权词嵌入改进文本分类,神经计算,363,366-374(2019)
[27] du Jardin,P.,应用于破产预测的动态自组织特征图模型,决策支持系统,147(2021)
[28] Kang,Y。;蔡,Z。;Tan,C.-W。;黄,Q。;Liu,H.,《管理研究中的自然语言处理:文献综述》,《管理分析杂志》,第7期,第2期,第139-172页(2020年)
[29] Kim,D。;Seo,D。;Cho,S。;Kang,P.,《使用各种文档表示进行文档分类的多重训练:TF-IDF、LDA和Doc2Vec,信息科学》,477,15-29(2019)
[30] Kim,Y.(2014)。用于句子分类的卷积神经网络。arXiv预打印arXiv:1408.5882v2
[31] Kingma,D.P。;Lei Ba,J.,Adam:随机优化方法,第三届学习表征国际会议(2015)
[32] Kou,G.等人。;Xu,Y。;彭,Y。;沈,F。;陈,Y。;Chang,K。;Kou,S.,《利用交易数据和两阶段多目标特征选择进行中小企业破产预测》,决策支持系统,140(2021)
[33] Kovács,G.,《在大量不平衡数据集上对少数人过采样技术的实证比较和评估》,应用软计算,83(2019)
[34] 克劳斯,M。;Feuerriegel,S。;Oztekin,A.,《商业分析和运营研究的深度学习:模型、应用和管理含义》,《欧洲运营研究杂志》,281,3628-641(2020)
[35] Kumar,P.R。;Ravi,V.,《通过统计和智能技术预测银行和公司破产——综述》,《欧洲运筹学杂志》,180,1-28(2007)·Zbl 1114.91305号
[36] 科瓦姆,H。;塞勒莱特,N。;Aas,K。;Sjursen,S.,使用卷积神经网络预测抵押贷款违约,应用专家系统,102,207-217(2018)
[37] Le,Q。;Mikolov,T.,句子和文档的分布式表示,机器学习国际会议,1188-1196(2014)
[38] LeCun,Y.,《反向传播的理论框架》,《1988年连接主义模型暑期学校学报》,21-28(1988)
[39] LeCun,Y。;博图,L。;奥尔·G。;Müller,K.-R.,高效BackProp,神经网络:交易技巧,9-50(1998),Springer-Verlag
[40] Lee,Y。;Kozar,K.A.,《调查网站质量对电子商务成功的影响:层次分析法》,决策支持系统,42,1383-1401(2006)
[41] Li,J.、Monroe,W.和Jurafsky,D.(2016)。通过表示删除理解神经网络。arXiv预打印arXiv:1612.08220。
[42] Liang,D。;卢,C.-C。;蔡家富。;Shih,G.-A.,《破产预测中的财务比率和公司治理指标:综合研究》,《欧洲运筹学杂志》,252561-572(2016)
[43] Mai,F。;田,S。;Lee,C。;Ma,L.,使用文本披露进行破产预测的深度学习模型,《欧洲运筹学杂志》,274743-758(2019)
[44] Manthoulis,G。;Doumpos,M。;Zopounidis,C。;Galariotis,E.,《银行破产预测的有序分类框架:美国银行的方法和经验证据》,《欧洲运筹学杂志》,282786-801(2020)
[45] Mikolov,T.、Chen,K.、Corrado,G.和Dean,J.(2013)。向量空间中单词表示的有效估计。arXiv预打印arXiv:1301.3781v3。
[46] 比利时国家银行(2015)。大小条件。检索自https://www.nbb.be/en/central-balance-sheet-office/drawing/size-criteria/size-criteria-companies公司。访问日期:2020年12月11日。
[47] Petropoulos,A。;Siakoulis,V.公司。;Stavroulakis,E。;Vlachogiannakis,N.E.,《使用机器学习技术预测银行破产》,《国际预测杂志》,第36期,第1092-1113页(2020年)
[48] Schäfer,K。;Kummer,T.-F.,《确定基于网站的关系营销的绩效》,《应用专家系统》,40,7571-7578(2013)
[49] Shumway,T.,《更准确地预测破产:一个简单的风险模型》,来源:《商业杂志》,74,1,101-124(2001)
[50] 北斯利瓦斯塔瓦。;辛顿,G。;Krizhevsky,A。;Salakhutdinov,R.,《辍学:防止神经网络过度拟合的简单方法》,《机器学习研究杂志》,1929-1958年,第15期(2014年)·Zbl 1318.68153号
[51] Tam,K.Y.,《神经网络模型与银行破产预测》,OMEGA国际管理科学杂志,19,5,429-445(1991)
[52] 托勒赫特,D。;Van Den Poel,D.,通过挖掘其公共访问网站的文本预测电子商务公司的成功,应用专家系统,39,13026-13034(2012)
[53] Tsai,C.-F.,破产预测中的特征选择,基于知识的系统,22,120-127(2008)
[54] 瓦斯瓦尼,A。;北沙泽尔。;北卡罗来纳州帕尔马。;Uszkoreit,J。;Jones,L。;戈麦斯,A.N。;Polosukhin,I.,《注意力是你所需要的一切》,《神经信息处理系统进展》(2017),Curran Associates,Inc。
[55] Wu,W.W.,《超越业务失败预测》,应用专家系统,37,3,2371-2376(2010)
[56] 徐,S。;E、 美国。;Xiang,Y.,用于句子对建模的增强型专注卷积神经网络,应用专家系统,151113384(2020)
[57] 张,G。;胡敏英。;巴图沃,B.E。;Indro,D.C.,《破产预测中的人工神经网络:一般框架和交叉验证分析》,《欧洲运筹学杂志》,116,1,16-32(1999)·Zbl 0995.62506号
[58] 周,L.,企业破产预测模型在不平衡数据集上的表现:抽样方法的影响,基于知识的系统,41,16-25(2013)
[59] 周,M。;Duan,N。;刘,S。;Shum,H.-Y.,《神经NLP的进展:建模、学习和推理》,《工程学》,6275-290(2020)
[60] 朱,M。;Ghodsi,A.,通过使用剖面可能性从碎石图中自动选择维度,计算统计与数据分析,51,918-930(2006)·Zbl 1157.62429号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。