×

贷款人如何才能繁荣?比较机器学习方法以确定可盈利的点对点贷款投资。 (英语) Zbl 1487.91146号

总结:成功的对等(P2P)贷款需要从大量贷款中评估贷款盈利能力。对贷款盈利能力的预测可能有助于对潜在投资进行排名。我们调查各种预测方法和贷款清单特征中包含的信息类型是否对盈利投资有影响。基于借贷俱乐部发布的P2P贷款的大型数据集,使用了一系列方法和性能指标来对预测性能进行基准测试。稳健线性混合模型用于调查模型之间的性能差异,根据它们是否假设线性、是否构建集合以及使用何种类型的预测因子。主要发现是:线性方法在几个(但不是所有)标准上表现出奇地好;集合方法的性能是否优于单个方法取决于度量;使用基于文本的替代信息并不能改善利润评分结果。我们得出的结论是,P2P贷款人可以通过应用直接预测内部收益率的线性方法而不是其他因变量(如贷款违约)来潜在地增加其投资回报。

MSC公司:

91G40型 信用风险
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Aiello,S.、Eckstrand,E.、A.Fu,A.、Landry,M.和Aboyoun,P.(2019年)。过氧化氢:过氧化氢的R界面。R套装版本3.26.0.11http://www.h2o.ai。
[2] Anagostopoulos,C.和Hand,D.(2012年)。hmeasure:h度量和其他标量分类性能度量。R包版本1.0http://CRAN.R-project.org/package=hmeasure。
[3] Balyuk,T。;Davydenko,S.A.,《金融科技再中介:来自在线借贷的证据》,SSRN,1-54(2018)
[4] Berg,T。;伯格,V。;Gombović,A。;Puri,M.,《金融科技的崛起:利用数字足迹进行信用评分》,《金融研究评论》,第33、7、2845-2897页(2019年)
[5] Bianchi,D。;Büchner,M。;Tamoni,A.,机器学习的债券风险溢价,SSRN,1-84(2018)
[6] http://jmlr.org/papers/v17/15-066.html。 ·Zbl 1392.68007号
[7] R.A.布雷。;Myers,S.C.,《公司财务原理》(2001),麦格劳-希尔出版社
[8] Breiman,L.,《随机森林,机器学习》,45,1,5-32(2001)·Zbl 1007.68152号
[9] Butaru,F。;陈,Q。;B.克拉克。;达斯,S。;Lo,A.W。;Siddique,A.,《信用卡行业的风险和风险管理》,《银行与金融杂志》,72,C,218-239(2016)
[10] Candel,A.、LeDell,E.、Arora,A.和Parmar,V.(2020年)。深入学习h2o。http://h2o.ai/resources。
[11] Cer,D.、Yang,Y.、Kong,S.-Y.、Hua,N.、Limtiaco,N.,John,R.S.、Constant,N.和Guayardo-Cespedes,M.、Yuan,S.、Tar,C.、Sung,Y.-H.、Strope,B.和Kurzweil,R.(2018年)。通用句子编码器。阿西夫,(第1-7页)。
[12] Chen,T。;Guestrin,C.,XGBoost,第22届ACM SIGKDD国际会议,785-794(2016),ACM出版社:美国纽约州纽约市ACM出版社
[13] Devlin,J.、Chang,M.-W.、Lee,K.和Toutanova,K.(2018年)。BERT:深度双向变换器的预训练,用于语言理解。阿西夫,(第1-16页)。
[14] 多佛利特纳,G。;Priberny,C。;舒斯特,S。;Stoiber,J。;韦伯,M。;德卡斯特罗一世。;Kammler,J.,《对等贷款中的描述-文本相关软信息:来自两个主要欧洲平台的证据》,《银行与金融杂志》,64,C,169-187(2016)
[15] 杜阿尔特,J。;西格尔,S。;Young,L.,《信任与信贷:外表在对等借贷中的作用》,《金融研究评论》,第25、8、2455-2484页(2012年)
[16] R.埃米克特。;Tu,Y。;Jirasakuldech,B。;Lu,M.,评估在线对等(P2P)借贷中的信用风险和贷款绩效,应用经济学,47,1,54-70(2014)
[17] 风机,R.-E。;Chang,K.-W。;谢长杰。;王,X.-R。;Lin,C.-J.,LIBLINEAR:大型线性分类库,《机器学习研究杂志》,1871-1874年8月9日(2008)·Zbl 1225.68175号
[18] Friedman,J.H.,多元自适应回归样条,《统计年鉴》,19,1,1-141(1991)·Zbl 0765.62064号
[19] 弗里德曼,J.H。;哈斯蒂,T。;Tibshirani,R.,通过坐标下降广义线性模型的正则化路径,统计软件杂志,33,1,1-22(2010)
[20] 保险丝,A。;Goldsmith-Pinkham,P。;拉马多赖,T。;Walther,A.,可预测的不平等?机器学习对信贷市场的影响,SSRN电子期刊,1-73(2018)
[21] 加里多,F。;韦贝克,W。;Bravo,C.,二元分类模型评估的稳健利润衡量,《应用专家系统》,92,154-160(2018)
[22] Guo,C.和Berkhahn,F.(2016)。分类变量的实体嵌入。阿西夫,(第1-9页)。
[23] 郭毅。;周,W。;罗,C。;刘,C。;Xiong,H.,P2P借贷投资决策的基于实例的信用风险评估,《欧洲运筹学杂志》,249,2,417-426(2016)·Zbl 1346.91250号
[24] Helleputte,T.(2017)。Liblinear:基于Liblinear c/c++库的线性预测模型。R包版本2.10-8。
[25] Hertzberg,A。;利伯曼,A。;Paravisini,D.,《到期日的逆向选择:来自在线消费信贷的证据》,《面向家庭和小企业的金融创新在线贷款》,1-66(2016)
[26] 55-14 ·Zbl 0202.17205号
[27] Jagtiani,J。;Lemieux,C.,《金融科技借贷:金融包容性、风险定价和替代信息》,《技术报告》(2017),费城联邦储备银行,宾夕法尼亚州费城研究院
[28] Jagtiani,J。;Lemieux,C.,《替代数据和机器学习在金融科技借贷中的作用:来自借贷俱乐部消费者平台的证据》,《技术报告》(2018年),费城联邦储备银行,宾夕法尼亚州费城研究所
[29] 卡拉佐格鲁,A。;Smola,A。;霍尼克,K。;Zeileis,A.,Kernlab:R中内核方法的S4包,《统计软件杂志》,11,9,1-20(2004)
[30] Kim,A。;Yang,Y。;莱斯曼,S。;马,T。;宋,M.C。;Johnson,J.E.V.,深度学习能预测风险散户投资者吗?《金融风险行为预测的实证研究》,《欧洲运筹学杂志》,2019年第1-18期
[31] Koller,M.,Robustlmm:线性混合效应模型稳健估计的r包,《统计软件杂志》,75,1,1-24(2016)
[32] 莱斯曼,S。;Baesens,B。;Seow,H.-V。;Thomas,L.C.,《信用评分的标杆先进分类算法:研究更新》,《欧洲运筹学杂志》,247,1,124-136(2015)·Zbl 1346.90835号
[33] 莱斯曼,S。;Voß,S.,《汽车转售价格预测:回归方法、私人信息和异质性对预测准确性的影响》,《国际预测杂志》,33,4,864-877(2017)
[34] 利伯蒂,J.M。;Petersen,M.A.,《信息:硬与软》,工作论文(2017),西北大学凯洛格学院
[35] Lin,M.,《文本的经济价值:来自在线债务众筹的证据》,《面向家庭和小企业的金融创新在线贷款》,1-37(2016)
[36] Liu,T.-Y.,Learning to rank for information retrieval and natural language processing,7(2011),施普林格:施普林格柏林,海德堡·Zbl 1227.68002号
[37] Malekipirbazari,M。;Aksakalli,V.,《通过随机森林进行社会借贷的风险评估》,《应用专家系统》,第42、10、4621-4631页(2015年)
[38] Mevik,B.-H。;Wehrens,R.,《pls包:R中的主成分和偏最小二乘回归》,《统计软件杂志》,18,1,1-23(2007)
[39] Mikolov,T。;Sutskever,I。;Chen,K。;Corrado,G.S。;Dean,J.,单词和短语的分布式表示及其组成,神经信息处理系统NIPS的进展,3111-3119(2013)
[40] Millborw,S.(2018年)。地球:多元自适应回归样条曲线。R软件包版本4.6.0。
[41] Miller,S.,《消费信贷市场中的信息与违约:来自自然实验的证据》,《金融中介杂志》,第24、1、45-70页(2015年)
[42] 彼得斯,M.E。;Neumann,M。;Iyyer,M。;加德纳,M。;克拉克,C。;Lee,K。;Zettlemoyer,L.,深层语境化词语表征,Proc。NAACL(2018)
[43] [在线;2014年7月10日访问]https://github.com/harrysouthworth/gbm/blob/master/inst/doc/gbm.pdf。
[44] 塞拉诺·辛卡,C。;Gutiérrez-Nieto,B.n.,《在对等(P2P)贷款中使用利润评分作为信用评分系统的替代方法》,决策支持系统,89,C,113-122(2016)
[45] Sirignano,J.、Sadhwani,A.和Giesecke,K.(2016)。抵押贷款风险的深度学习。阿西夫,(第1-83页)。
[46] Stevenson,M.、Mues,C.和Bravo,C.(2020年)。文本对小企业违约预测的价值:一种深度学习方法。阿西夫,(第1-25页)。
[47] Tibshirani,R.,《通过套索进行回归收缩和选择》,《皇家统计学会杂志:B辑(统计方法)》,58,1,267-288(1996)·兹比尔0850.62538
[48] Vallee,B.和Zeng,Y.(2018年)。市场借贷:一种新的银行模式?,。(第1-60页)。https://www.hbs.edu/caustructure/Pages/item.aspx?num=53870。
[49] Verbraken,T。;布拉沃,C。;韦伯,R。;Baesens,B.,《使用基于利润的分类方法开发和应用消费者信用评分模型》,《欧洲运筹学杂志》,238,2,505-513(2014)·Zbl 1338.91146号
[50] Wright,M.N。;齐格勒,A.,《Ranger:C++和R中高维数据随机森林的快速实现》,《统计软件杂志》,77,1,1-17(2017)
[51] 严,X。;郭杰。;Lan,Y。;Cheng,X.,《短文本的Biterm主题模型》,Www'13出版物《第二届国际互联网大会Www会议记录》,1445-1456(2013)
[52] 齐格勒,T。;Shneor,R。;Wenzlaff,K。;万欣,B.W。;Kim,J。;奥多罗维奇,A。;Johanson,D.,《全球另类融资基准报告》,《技术报告(2020)》,剑桥大学贾奇商学院剑桥另类金融中心:剑桥大学贾奇商学院剑桥替代金融中心
[53] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,《皇家统计学会杂志:B辑(统计方法)》,67,2,301-320(2005)·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。