×

多时间片培训如何提高流失预测性能。 (英语) Zbl 1487.90409号

摘要:使用机器学习分类的客户流失预测模型主要是通过对一个时间段的数据进行培训和测试来开发的。我们在数据的多个时间片上训练模型,并将此方法称为多时段。我们的结果表明,与将整个数据集作为一个时间片进行训练相比,在相同的数据时间框架下,多时段训练显著提高了流失预测性能。我们证明,除了增加训练集大小外,改进还取决于对不同时间段样本的训练。对于来自便利批发商的数据,我们表明,多策略解决了流失样本的稀缺性以及在单个培训时间段内过度满足特定情况的风险。多策略使模型更具通用性,这在条件随时间变化或波动时尤为重要。我们还讨论了如何选择时间片的数量。

MSC公司:

90B60毫米 营销、广告
68T05型 人工智能中的学习和自适应系统

软件:

SMOTE公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安德森,E。;Weitz,B.,《传统产业渠道二元结构中连续性的决定因素》,《营销科学》,8,4,310-323(1989)
[2] 选票,M。;Van den Poel,D.,客户流失预测的客户事件历史:多长时间足够?,应用专家系统,39,18,13517-13522(2012)
[3] Ballings,M。;Van Den Poel,D.,《社交媒体中的CRM:预测Facebook使用频率的增长》,《欧洲运筹学杂志》,244,1,248-260(2015)·Zbl 1346.90412号
[4] Bose,I。;Chen,X.,《直接营销的定量模型:从系统角度的回顾》,《欧洲运筹学杂志》,195,1,1-16(2009)·兹比尔1159.90434
[5] Breiman,L.,《随机森林,机器学习》,45,1,5-32(2001)·Zbl 1007.68152号
[6] 布金克斯,W。;Van den Poel,D.,《客户基础分析:非契约快速消费品零售环境中行为忠诚客户的部分流失》,《欧洲运筹学杂志》,164,1,252-268(2005)·Zbl 1132.90349号
[7] Burez,J。;Van den Poel,D.,《付费电视公司的CRM:使用分析模型通过订阅服务的目标营销减少客户流失》,《应用专家系统》,32,2,277-288(2007)
[8] 布里兹,J。;Van den Poel,D.,《将金融与商业客户流失分离:解决销售和信贷部门之间冲突的建模步骤》,《应用专家系统》,35,1-2,497-514(2008)
[9] Burez,J。;Van den Poel,D.,处理客户流失预测中的等级不平衡,应用专家系统,36,3,4626-4636(2009)
[10] 查拉,N.V。;鲍耶,K.W。;洛杉矶霍尔。;Kegelmeyer,W.P.,SMOTE:合成少数人过采样技术,《人工智能研究杂志》,16,321-357(2002)·Zbl 0994.68128号
[11] 陈,C。;Liaw,A。;Brieman,L.,使用随机森林学习不平衡数据:第666号技术报告。加州大学伯克利分校,使用随机森林学习不平衡数据,110,1-12,12(2004)
[12] Chen,K。;胡永华。;谢义忠,《预测物流行业有价值B2B客户的客户流失:案例研究》,《信息系统和电子商务管理》,第13、3、475-494页(2015年)
[13] 陈,Z.-Y。;风扇,Z.-P。;Sun,M.,使用纵向行为数据预测客户流失的分层多核支持向量机,《欧洲运筹学杂志》,223,2,461-472(2012)·Zbl 1292.68131号
[14] 库塞门特,K。;De Bock,K.W.,《在线赌博行业的客户流失预测:集成学习的有益影响》,《商业研究杂志》,66,9,1629-1636(2013)
[15] 库塞门特,K。;莱斯曼,S。;Verstraeten,G.,《客户流失预测数据准备算法的比较分析:电信行业的案例研究》,《决策支持系统》,95,27-36(2017)
[16] 库塞门特,K。;Van den Poel,D.,《订阅服务中的客户流失预测:比较两种参数选择技术时支持向量机的应用》,《专家系统与应用》,34,1,313-327(2008)
[17] 库塞门特,K。;Van den Poel,D.,《通过整合客户/公司交互电子邮件中的情绪和评估多个分类器来改进客户流失预测》,《应用专家系统》,36,3,6127-6134(2009)
[18] De Bock,K.W。;Van Den Poel,D.,使用基于广义加性模型的集成学习协调客户流失预测中的性能和可解释性,应用专家系统,39,8,6816-6826(2012)
[19] 德凯尼,A。;库塞门特,K。;De Bock,K.W.,基于逻辑回归和决策树的客户流失预测新混合分类算法,《欧洲运筹学杂志》,269,2,760-772(2018)·Zbl 1388.90061号
[20] Demšar,J.,多数据集上分类器的统计比较,机器学习研究杂志,7,1-30(2006)·Zbl 1222.68184号
[21] Dietterich,T.G.,用于比较监督分类学习算法的近似统计检验,神经计算,10,7,1895-1923(1998)
[22] Egan,J.P.(1975年)。信号检测理论和ROC分析。认知和感知的系列。学术出版社。
[23] Farquad,医学硕士。;拉维,V。;Raju,S.B.,《使用可理解支持向量机的客户流失预测:分析CRM应用》,《应用软计算杂志》,第19期,第31-40页(2014年)
[24] 加西亚,D.L。;内博,±。;Vellido,A.,《将客户流失视为商业问题的智能数据分析方法:调查》,《知识与信息系统》,51,3,719-774(2017)
[25] 格拉迪,N。;Baesens,B。;Croux,C.,《使用客户生命周期价值建模客户流失》,《欧洲运筹学杂志》,197,1,402-411(2009)·Zbl 1157.91396号
[26] 居尔·阿里。;Arítürk,U.,《更有效使用罕见事件数据的动态客户流失预测框架:私人银行案例》,《应用专家系统》,41、17、7889-7903(2014)
[27] 盖恩,I。;J·韦斯顿。;巴恩希尔,S。;Vapnik,V.,使用支持向量机进行癌症分类的基因选择,机器学习,46,1-3,389-422(2002)·兹比尔0998.68111
[28] 贾普科维奇,N。;Stephen,S.,《阶级失衡问题:系统研究》,《智能数据分析》,2002年第6期,第5期,第429-449页·兹比尔1085.68628
[29] Kohavi,R。;John,G.H.,《特征子集选择的包装器》,人工智能,97,1-2,273-324(1997)·Zbl 0904.68143号
[30] 库马尔,D.A。;Ravi,V.,《使用数据挖掘预测银行信用卡客户流失》,《国际数据分析技术与策略杂志》,第1期,第4-28页(2008年)
[31] 拉里维埃,B。;Van Den Poel,D.,《利用生存分析和选择模型研究产品特征在防止客户流失中的作用:金融服务案例》,《应用专家系统》,27,2,277-285(2004)
[32] 拉里维埃,B。;Van den Poel,D.,使用随机森林和回归森林技术预测客户保留和盈利能力,应用专家系统,29,2,472-484(2005)
[33] 莱斯曼,S。;Voß,S.,《使用支持向量机进行以客户为中心的数据挖掘的参考模型》,《欧洲运筹学杂志》,199,2,520-530(2009)·Zbl 1176.90340号
[34] Leung,H.C.和Chung,W.(2020年)。银行业客户流失预测的动态分类方法。在Amcis 2020中,数据科学和分析用于决策支持(sigdsa)。信息系统协会。
[35] 米盖斯,V。;卡曼霍,A。;Falcáo e.Cunha,J.,《零售业中的客户流失:多元自适应回归样条的应用》,《应用专家系统》,第40、16、6225-6232页(2013年)
[36] 米盖斯,V。;Van den Poel,D。;卡曼霍,A。;Falcão e.Cunha,J.,部分客户流失建模:关于第一类产品购买序列的价值,应用专家系统,39,11250-11256(2012)
[37] Neslin,S.A。;古普塔,S。;镰仓,W。;卢,J。;Mason,C.H.,《缺陷检测:测量和理解客户流失模型的预测准确性》,《营销研究杂志》,第43、2、204-211页(2006年)
[38] 奥斯卡尔斯多蒂尔,M。;布拉沃,C。;韦贝克,W。;Sarraute,C。;Baesens,B。;Vanthienen,J.,《电信公司流失预测的社会网络分析:模型构建、评估和网络架构》,《应用专家系统》,85,204-220(2017)
[39] Piatetsky-Shapiro,G。;Masand,B.,《估算竞选收益和建模提升》,第五届ACM SIGKDD国际知识发现和数据挖掘会议论文集-KDD’99,185-193(1999),ACM出版社:美国纽约州纽约市ACM出版社
[40] Reichheld,F.F.,《从客户流失中学习》,《哈佛商业评论》,74,2,56-69(1996)
[41] Risselada,H。;P.C.弗霍夫。;Bijmolt,T.H.,《流失预测模型的持久力》,《互动营销杂志》,2010年第24期,第3期,第198-208页
[42] Seppälä,T。;Thuy,L.,《多阶段培训数据和集成方法的组合以改进住房贷款客户流失分类》,《第二届高级研究方法和分析国际会议论文集》(CARMA 2018),141-144(2018),瓦莱尼亚政治大学
[43] Somol等人。;Baesens,B。;普迪尔,P。;Vantheinen,J.,《信用评分中基于过滤器与包装器的特征选择》,《国际智能系统杂志》,20,10,985-999(2005)
[44] Tamaddoni Jahromi,A。;斯塔克霍维奇,S。;Ewing,M.,《管理B2B客户流失、保留和盈利能力》,《工业营销管理》,第43、7、1258-1268页(2014年)
[45] Vapnik,V.N.,《统计学习理论的本质》(1995),斯普林格出版社:纽约斯普林格·Zbl 0833.62008号
[46] 韦贝克,W。;Dejaeger,K。;Martens,D。;胡尔,J。;Baesens,B.,《电信行业流失预测的新见解:利润驱动的数据挖掘方法》,《欧洲运筹学杂志》,218,1,211-229(2012)
[47] 韦贝克,W。;Martens,D。;梅斯,C。;Baesens,B.,用先进的规则归纳技术建立可理解的客户流失预测模型,专家系统与应用,38,332354-2364(2011)
[48] 魏春平。;Chiu,I.-T.,将电信呼叫细节转化为客户流失预测:数据挖掘方法,应用专家系统,23,2,103-112(2002)
[49] Weiss,G.M.,《稀有采矿:统一框架》,SIGKDD Explorations,6,1,7-19(2004)
[50] Wilcoxon,F.,《通过排名方法进行的个体比较》,《生物计量学公报》1、6、80-83(1945年)
[51] 扎哈维,J。;莱文,N.,《将神经计算应用于目标营销》,《直接营销杂志》,1997年第11期,第1期,第5-22页
[52] Zeithaml,V.A.公司。;Berry,L.L。;Parasuraman,A.,《服务质量的行为后果》,来源:《市场营销杂志》,60,2,31-46(1996)
[53] 朱,B。;Baesens,B。;巴基尔,A。;Vanden Broucke,S.K.,《流失预测中不平衡学习的基准抽样技术》,运筹学学会杂志,69,1,49-65(2017)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。