×

客户回购预测分析:买到死建模和机器学习的跨学科集成。 (英语) Zbl 1490.62432号

摘要:预测客户回购倾向/频率已受到市场营销、运筹学、统计学和计算机科学的广泛研究兴趣。在市场营销领域,买到死(BTYD)模型可能是最具代表性的客户再购买预测技术。这些概率模型是简约的,通常只涉及客户活动的近况和频率。与BTYD模型相反,一类截然不同的客户再购买预测模型是机器学习。这类模型包括各种计算和统计学习算法。与基于低维输入和行为假设构建的BTYD模型不同,机器学习更注重数据驱动,擅长将预测模型拟合到客户交易的大量特征。使用大量在线零售数据,我们实证评估了BTYD建模和机器学习的预测性能。更重要的是,我们研究了这两种方法如何在回购预测中相互补充。我们使用BG/BB模型给出离散和非牵引问题设置,并将BG/BB估计纳入高维拉索回归。除了显示出比没有BG/BB的BG/BB和Lasso的显著改善外,集成的Lasso BG/BB提供了可解释性,并将BG/BB预测确定为\(\sim 100\)预测因子中最具影响力的特征。最近开发的CART人工神经网络显示出类似的模式。鲁棒性检验进一步表明,所提出的Lasso-BG/BB优于两个复杂的递归神经网络,验证了机器学习和BTYD建模的互补性。最后,我们阐述了两种建模范式的跨学科整合如何为预测分析的理论和实践做出贡献。

MSC公司:

62第20页 统计学在经济学中的应用
62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abe,M.,《逐个统计你的客户:对Pareto/NBD模型的分层Bayes扩展》,《营销科学》,28,3,541-553(2009)
[2] 北卡罗来纳州阿尔布凯。;Joukhadar,A。;Ghneim,N.,移动电信中基于动态行为的流失预测,应用专家系统,162,第113779页,(2020)
[3] Baesens,B。;维亚内,S。;Van den Poel,D。;Vantheinen,J。;Dedene,G.,直接营销中重复购买模型的贝叶斯神经网络学习,《欧洲运筹学杂志》,138,1,191-211(2002)·Zbl 1008.90515号
[4] 巴蒂斯拉姆,E.P。;Denizel,M。;Filiztekin,A.,《客户群分析模型的实证验证和比较》,《国际营销研究杂志》,2007年第24期,第3期,201-209年
[5] 布雷曼,L。;弗里德曼,J。;斯通,C.J。;Olshen,R.A.,分类和回归树(1984),CRC出版社·Zbl 0541.62042号
[6] Brownell,A.(2019)。RNNS与传统ML的预测客户终身价值。可在https://retina.ai/blog/rnns-vs-traditional-ml/
[7] 布金克斯,W。;Van den Poel,D.,《客户基础分析:非契约快速消费品零售环境中行为忠诚客户的部分流失》,《欧洲运筹学杂志》,164,1,252-268(2005)·Zbl 1132.90349号
[8] Burez,J。;Van den Poel,D.,处理客户流失预测中的等级不平衡,应用专家系统,36,3,4626-4636(2009)
[9] 塞奎拉,V。;托戈,L。;Mozetić,I.,《评估时间序列预测模型:性能估计方法的实证研究》,机器学习,109,11,1997-2028(2020)
[10] Chakraborty,T。;查克拉博蒂,A.K。;Murthy,C.A.,非参数集合二元分类器及其统计特性,《统计与概率快报》,149,16-23(2019)·Zbl 1459.62107号
[11] Chatfield,C.,《模型不确定性、数据挖掘和统计推断》,《皇家统计学会杂志:A辑(社会统计)》,158,3,419-444(1995)
[12] 查特拉,S.B。;Shmueli,G.,对具有二元结果变量的回归模型的广泛检验,信息系统协会杂志,18,4,1(2017)
[13] 陈,P.P。;吉塔特,A。;del Río,A.F。;Periánez,A.,使用深度学习和参数模型的视频游戏中的客户终身价值,(2018年IEEE大数据国际会议(大数据)(第2134-2140页)(2018),IEEE)
[14] Cholet,F.,《深度学习与蟒蛇》(2017),曼宁出版社
[15] 周,Y.C。;Chung,H.H.C.,在线预订服务中首次客户保留率的预测调查,服务商业,12,4685-699(2018)
[16] 库塞门特,K。;De Bock,K.W.,《在线赌博行业的客户流失预测:集成学习的有益影响》,《商业研究杂志》,66,9,1629-1636(2013)
[17] 崔,H。;拉贾戈帕兰,S。;Ward,A.R.,使用机器学习方法预测产品退货量,《欧洲运筹学杂志》,281,3,612-627(2020)
[18] 崔,R。;加利诺,S。;莫雷诺,A。;张德杰,《社交媒体信息的运营价值,生产与运营管理》,27,10,1749-1769(2018)
[19] Davis,J。;伯恩赛德,E.S。;德卡斯特罗·杜特拉,I。;页码,D。;罗摩克里希南,R。;Costa,V.S.,《统计关系学习的视图学习:应用于乳房X射线照相术》,IJCAI,677-683(2005)
[20] Davis,J。;Goadrich,M.,《精确回归和ROC曲线之间的关系》,(第23届机器学习国际会议论文集(2006)),233-240
[21] De Bock,K.W。;Van den Poel,D.,《基于旋转的集成分类器用于客户流失预测的实证评估》,《应用专家系统》,38,10,12293-12301(2011)
[22] De Bock,K.W。;Van den Poel,D.,使用基于广义加性模型的集成学习协调客户流失预测中的性能和可解释性,应用专家系统,39,8,6816-6826(2012)
[23] De Caigny,A。;库塞门特,K。;De Bock,K.W.,基于逻辑回归和决策树的客户流失预测新混合分类算法,《欧洲运筹学杂志》,269,2,760-772(2018)·Zbl 1388.90061号
[24] Demšar,J.,《多数据集分类器的统计比较》,《机器学习研究杂志》,2006年1月7日至30日·Zbl 1222.68184号
[25] 露水,R。;Ansari,A.,《基于模型可视化的贝叶斯非参数客户群分析》,《营销科学》,37,2,216-235(2018)
[26] Dietterich,T.G.,用于比较监督分类学习算法的近似统计检验,神经计算,10,7,1895-1923(1998)
[27] 杜森贝里,M.W。;Tran,D。;Choi,E。;肯普,J。;尼克松,J。;Jerfel,G.,《分析电子健康记录模型不确定性的作用》(ACM健康、推理和学习会议论文集(2020年)),204-213
[28] 费德,P.S。;Hardie,B.G.,《基于客户分析的概率模型》,《互动营销杂志》,23,1,61-69(2009)
[29] 费德,P.S。;哈迪,B.G。;Lee,K.L.,《计算客户数的简单方法:帕累托/NBD模型的替代方法》,《营销科学》,24,2275-284(2005)
[30] 费德,P.S。;哈迪,B.G。;Shang,J.,《离散时间非契约环境下的客户基础分析》,《营销科学》,29,6,1086-1108(2010)
[31] 高蒂尔,J.(2017)。介绍预测性客户终身价值建模。可在https://blogs.oracle.com/datascience/an-introduction-to-redictive-customer-lifetime-value-modeling
[32] 古德费罗,I。;Y.本吉奥。;科尔维尔,A。;Bengio,Y.,深度学习(2016),麻省理工学院出版社:麻省理工学院出版社剑桥·Zbl 1373.68009号
[33] 谷歌云(2019)。使用AI平台预测客户终身价值:简介。可在https://cloud.google.com/solutions/machine-learning/clv-definition-with-offline-training-intro
[34] Gopalakrishnan,A。;布拉德洛,E.T。;Fader,P.S.,《基于客户分析的跨队列变化点模型》,《营销科学》,36,2,195-213(2017)
[35] 古普塔,S。;Hanssens,D。;哈迪,B。;Kahn,W。;库马尔,V。;Lin,N.,《客户终身价值建模》,《服务研究杂志》,9,2,139-155(2006)
[36] 哈登,J。;Tiwari,A。;罗伊·R。;Ruta,D.,《计算机辅助客户流失管理:现状和未来趋势》,《计算机与运营研究》,34,10,2902-2917(2007)·Zbl 1185.90119号
[37] Holtrop,N。;Wieringa,J.E。;Gijsenberg,M.J。;P.C.弗霍夫,没有过去就没有未来?《面对客户隐私预测客户流失》,《国际营销研究杂志》,34,1,154-172(2017)
[38] 霍普曼,J。;Thede,A.,《非契约环境下客户流失预测的适用性》,分类、数据科学和信息系统创新,330-337(2005),施普林格:施普林格柏林,海德堡·Zbl 05243419号
[39] M.C.休斯。;普雷迪尔,M.F。;罗斯,A.S。;McCoy,T.H。;Perlis,R.H。;Doshi-Velez,F.,使用监督主题模型评估抗抑郁药物治疗稳定性预测模型,JAMA Network Open,3,5,文章e205308 pp.(2020),e205308
[40] Jahn,M.,《面板环境中的人工神经网络回归模型:预测经济增长》,《经济建模》,第91期,第148-154页(2020年)
[41] Jahromi,A.T。;斯塔霍维奇,S。;尤因,M.,《客户流失模型:概率和数据挖掘方法的比较》,《展望,回顾:利用过去塑造营销的未来》,144-148(2016),《施普林格:施普林格-查姆》
[42] Jerath,K。;费德,P.S。;Hardie,B.G.,《使用帕累托/NBD模型的概括来看待客户“死亡”的新观点》,《营销科学》,30,5866-880(2011)
[43] Keramati,A。;贾法里·马兰迪,R。;Aliannejadi先生。;艾哈迈迪安。;莫扎法里,M。;Abbasi,U.,《使用数据挖掘技术改进电信行业流失预测》,应用软计算,24994-1012(2014)
[44] Kingma,D.P.和Ba,J.(2014)。亚当:一种随机优化方法。arXiv预打印arXiv:1412.6980。
[45] Klug,M。;Barash,Y。;贝克勒,S。;Resheff,Y.S。;Tron,T。;Ironi,A.,《预测急诊分诊早期死亡率的梯度推进机器学习模型:设计九分分诊评分》,《普通内科杂志》,35,1,220-227(2020)
[46] 阿迪·扬斯基,P。;Ż比科夫斯基,K。;Gawrysik,P.,《利用深度学习和随机森林在零售银行业开展直接营销活动》,《应用专家系统》,134,28-35(2019)
[47] Lemmens,A。;Gupta,S.,《管理流失以实现利润最大化》,《营销科学》(2020年),即将出版
[48] 马丁内斯。;施穆克,C。;Pereverzyev Jr,,S。;Pirker,C。;Haltmeier,M.,《非接触环境下客户购买预测的机器学习框架》,《欧洲运筹学杂志》,281,3588-596(2020)
[49] McCarthy,D.、Fader,P.和Hardie,B.(2016)。V(CLV):检查客户终身价值模型中的方差。可从SSRN 2739475获得。
[50] Medeiros,M.C。;曼德斯,E.F。,1-具有非高斯和异方差误差的高维时间序列模型的正则化,《计量经济学杂志》,191,1255-271(2016)·Zbl 1390.62179号
[51] 梅纳,C.G。;De Caigny,A。;库塞门特,K。;德博克,K.W。;Lessmann,S.,用序列数据和深度神经网络进行Churn预测,比较分析(2019),arXiv预印本arXiv:1909.11114
[52] 米盖斯,V.L。;Van den Poel,D。;Camanho,A.S。;e Cunha,J.F.,部分客户流失建模:关于第一类产品购买序列的价值,专家系统与应用,39,11250-11256(2012)
[53] 米洛舍维奇,M。;“伊维奇,N。;Andjelković,I.,移动社交游戏中个性化目标的早期流失预测,应用专家系统,83226-332(2017)
[54] 纳尔逊,S.D。;沃尔什,C.G。;奥尔森,C.A。;麦克劳林,A.J。;LeGrand,J.R。;Schutz,N.,《药学中人工智能的解密》,《美国健康系统药学杂志》,77,19,1556-1570(2020)
[55] 佩德雷戈萨,F。;瓦罗佐,G。;Gramfort,A.公司。;米歇尔,V。;蒂里昂,B。;Grisel,O.,Scikit-learn:《Python中的机器学习》,《机器学习研究杂志》,第12期,第2825-2830页(2011年)·Zbl 1280.68189号
[56] 普拉泽,M。;Reuter,T.,《抓紧时间:定时规律有助于更好地预测客户活动》,《营销科学》,35,5,779-799(2016)
[57] 乔,J。;Wang,L。;Yang,C.,基于修正贝叶斯信息准则的非线性系统建模自适应套索回波状态网络,神经计算与应用,31,10,6163-6177(2019)
[58] Rajkomar,A。;Oren,E。;Chen,K。;戴,A.M。;哈贾杰,N。;Hardt,M.,《利用电子健康记录进行可扩展和准确的深度学习》,NPJ数字医学,1,1,1-10(2018)
[59] 雷纳茨,W.J。;Kumar,V.,《非契约环境下长寿命客户的盈利能力:实证调查及其对营销的影响》,《营销杂志》,64,4,17-35(2000)
[60] 雷特,T。;普拉泽,M。;Schröder,N.,《利用购买规律轻松预测客户行为》,《国际市场营销研究杂志》(2020年),出版中
[61] 鲁丁,C。;Carlson,D.,《机器学习的秘密:你希望早点知道的十件事在数据分析、分析时代的运筹学和管理科学方面更有效》,44-72(2019),INFORMS
[62] Salehinejad,H。;Rahnamayan,S.,《顾客购物模式预测:递归神经网络方法》,(2016年IEEE计算智能(SSCI)系列研讨会(2016年),IEEE),1-6
[63] 施密特林特区。;莫里森,D.G。;科伦坡,R.,计算你的客户:他们是谁,接下来会做什么?,管理科学,33,1,1-24(1987)
[64] 施瓦茨,E.M。;布拉德洛,E.T。;Fader,P.S.,《利用数据库特征进行模型选择:为纵向发病率数据建立分类树》,《市场营销科学》,33,2,188-205(2014)
[65] Schweidel,D.A。;Knox,G.,《将直接营销活动纳入潜在流失模型》,《营销科学》,32,3471-487(2013)
[66] Shi,R。;陈,H。;Sethi,S.P.,《顾客在O2O市场中购买的广义计数模型》,《国际生产经济学杂志》,21512-130(2019)
[67] Smeekes,S。;Wijler,E.,《使用惩罚回归方法进行宏观经济预测》,《国际预测杂志》,34,3,408-430(2018)
[68] 索弗,S。;巴生,E。;Barash,Y。;格罗斯曼,E。;Zimlichman,E.,《预测病房入院时的住院死亡率:大数据机器学习模型》,《美国医学杂志》(2020)
[69] 苏,E。;Lim,S。;Hwang,H.等人。;Kim,S.,支持实时网络营销的匿名客户购买概率预测模型:案例研究,应用专家系统,27,2,245-255(2004)
[70] Tamaddoni,A。;斯塔克霍维奇,S。;尤因,M.,《比较流失预测技术并评估其性能:一个偶然的视角》,《服务研究杂志》,19,2,123-141(2016)
[71] Tibshirani,R.,《通过套索进行回归收缩和选择》,《皇家统计学会期刊:B辑(方法学)》,58,1,267-288(1996)·Zbl 0850.62538号
[72] Van Oest,R。;Knox,G.,《扩展BG/NBD:购买和投诉的简单模型》,《国际市场营销研究杂志》,第28、1、30-37页(2011年)
[73] 韦贝克,W。;Dejaeger,K。;Martens,D。;胡尔,J。;Baesens,B.,《电信行业流失预测的新见解:利润驱动的数据挖掘方法》,《欧洲运筹学杂志》,218,1,211-229(2012)
[74] 韦贝克,W。;Martens,D。;Mues,C.等人。;Baesens,B.,《使用高级规则归纳技术构建可理解的客户流失预测模型》,《应用专家系统》,38,3,2354-2364(2011)
[75] Wang,J。;蔡,Q。;Chang,Q。;Zurada,J.M.,通过群套索正则化对稀疏前馈神经网络的收敛性分析,信息科学,381250-269(2017)·Zbl 1429.68258号
[76] Wang,J。;赖,X。;张,S。;Wang,W.M。;Chen,J.,《预测汽车4S店的客户缺席:生命周期视角》,《人工智能的工程应用》,第89期,第103405条,pp.(2020)
[77] Wood-Doughty,Z.、Shpitser,I.和Dredze,M.(2020)将机器学习预测纳入因果估计的敏感性分析。
[78] 谢S.M.(2019)。基于神经网络的Pareto/NBD模型参数估计方法。arXiv预打印arXiv:1911.01919。
[79] 谢S.M。;Huang,C.Y.,《客户群预测准确性的系统比较:Pareto/NBD与神经网络》,《亚太市场营销与物流杂志》(2020年)
[80] Yu,R。;安,X。;Jin,B。;史J。;O.A.移动。;Liu,Y.,基于粒子分类优化的电信客户流失预测BP网络,神经计算与应用,29,3,707-720(2018)
[81] Zhang,H.Y.(2008)。使用BG/BB模型对离散时间事务进行建模。
[82] Zhang,Y。;布拉德洛,E.T。;Small,D.S.,《使用笨拙预测客户价值:从RFM到RFMC》,《营销科学》,第34、2、195-208页(2015年)
[83] 朱,B。;Baesens,B。;Van Den Broucke,S.K.,流失预测中阶级不平衡问题技术的实证比较,信息科学,408,84-99(2017)
[84] 朱,J。;Rosset,S。;Tibshirani,R。;Hastie,T.J.,1-范数支持向量机,《神经信息处理系统的进展》(2003),(p.None)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。