计算机工程与应用››2020,第56卷››问题(4): 219-224.内政部:10.3778/j.issn.1002-8331.1811-0089

• 工程与应用 • 上一篇   下一篇

面向高维数据的个人信贷风险评估方法

廖文雄,曾碧,梁天恺,徐雅芸,赵俊峰  

  1. 广东工业大学 计算机学院,广州 510006
  • 出版日期:2020-02-15 发布日期:2020-03-06

高维数据的个人信用风险评估方法

廖文雄、曾碧、梁天凯、徐亚云、赵俊峰  

  1. 广东工业大学计算机学院,广州510006
  • 在线:2020-02-15 出版:2020-03-06

摘要:

随着电商平台分期付款方式和P2P网络信贷平台的不断推广,如何从海量的用户信贷数据中挖掘出潜在的用户模型并对未知用户进行信贷风险评估,以降低信贷业务的风险,已经成为研究的主流。针对现有方法无法高效处理高维度信贷数据的问题,使用一系列的数据预处理方法和基于嵌入的思想的特征选择方法XGBFS(XGBoost功能选择)以降低用户信贷数据维度并训练出XGBoost公司评估模型,最终实现用户信贷风险评估。实验表明,与现有的方法相比,该方法能够从高维的数据中选择出重要属性,并且分类器在精确率、召回率等方面具有较为突出的性能。

关键词: XGBoost、, 特征选择, 机器学习, 信贷评估

摘要:

由于电子商务平台和P2P信贷平台的分期付款方式在不断推广。如何挖掘潜在用户模型,如何从海量的用户信用数据中评估未知用户的信用风险,从而降低信用业务的风险,已成为研究的主流。针对现有方法无法有效处理高维信用数据的问题,本文采用了一系列数据预处理方法和基于嵌入式思想的特征选择方法XGBFS(XGBoost feature selection)。该方法可以降低用户信用数据的维数,建立XGBoost评估模型,最终实现用户信用风险评估。与现有方法相比,实验结果表明,该方法可以从高维数据中选择重要特征。此外,该分类器在准确率和召回率方面有着更为突出的性能。

关键词: XGBoost、, 特征选择, 机器学习, 信用评估