计算机工程与应用››2023,第59卷››发行(21): 1-25.内政部:10.3778/j.issn.1002-8331.2302-0129

• 热点与综述 • 上一篇   下一篇

基于机器学习的信用卡交易欺诈检测研究综述

蒋洪迅,江俊毅,梁循  

  1. 中国人民大学 信息学院,北京 100872
  • 出版日期:2023-11-01 发布日期:2023-11-01

基于机器学习的信用卡交易欺诈检测研究综述

姜洪勋、姜俊毅、梁勋  

  1. 中国人民大学信息学院,北京100872
  • 在线:2023-11-01 出版:2023-11-01

摘要:机器学习在信用卡交易检测中有其特殊性,面对的环境更为复杂。由于有人的智力介入,战胜信用卡交易欺诈,其挑战性比人脸识别、无人驾驶等工程问题的难度更高,照搬工程学科的机器学习方法往往会失败。综述了2000年以来基于机器学习的信用卡欺诈检测研究历程,辨析了该领域的研究范畴、应用场景、技术流派等相关概念及其联系;解构了机器学习欺诈识别的一般性研究架构,从特征工程、模型算法、评价指标三个环节归纳总结了领域内研究的最新进展;从数据集是否具备标签角度,着重列举了面向欺诈识别的有监督的、无监督和半监督三类主流机器学习模型,讨论了这些模型的出发点、核心思想、求解方法以及优缺点;还分析了强化学习模型模拟欺诈者与机构之间的动态博弈过程;探讨了机器学习面临的海量数据、样本偏斜和概念漂移三大难点问题,并汇集整理了缓解这些问题的最新进展;总结了面向欺诈检测的机器学习研究目前存在的局限、争议和挑战,并为未来的研究方向提供趋势分析与建议。

关键词: 信用卡欺诈识别, 机器学习, 数据挖掘, 样本偏斜, 概念漂移

摘要:机器学习在信用卡交易检测方面有其独特性,面临着更复杂的环境。由于人类智能的介入,机器学习在欺诈检测方面遇到了比人脸识别和无人驾驶更困难的挑战,如果只应用工程学科的过程,就会导致失败。本文描述了2000年以来信用卡反欺诈研究的历史;确定了面向检测的机器学习领域的定义、范围、技术流、应用程序和其他关键概念及其相互联系;分析了欺诈检测的一般架构,并从特征工程、模型/算法和评估指标方面总结了交易欺诈检测研究的最新进展;讨论了信用卡交易欺诈的各种检测算法,列举了它们的初衷、核心思想、解决方法、优缺点和相关扩展;重点介绍了欺诈识别的无监督、有监督和半监督学习模型,以及级联和聚合模型等各种组合;解决了三大挑战,即海量数据、样本偏差和概念漂移,并编译了最新的进展来缓解这些问题。本文总结了机器学习在信用卡欺诈识别中的局限性、争议和挑战,并对未来的研究方向提供了趋势分析和建议。

关键词: 信用欺诈检测, 机器学习, 数据挖掘, 样本倾斜, 概念漂移