×

异构二进制数据的纵向聚类。 (英语) Zbl 1469.62406号

摘要:由于电子商务的成功和数字营销数据的可访问性,个性化营销已成为一项重要的营销战略。众所周知,不同的客户群体可能会因其个人偏好而对同一营销策略做出不同的反应。因此,我们提出了一种成对分组方法,可用于识别子组并将类似的营销效果分类为组。具体来说,我们在广义线性模型框架下将客户的购买决策建模为二元响应,同时合并了它们的纵向相关性。我们惩罚异质效应之间的成对距离以形成子组,其中子组与独特的营销效应相关。我们建立了子群识别的理论一致性,即能够成功恢复真正的底层分割结构。这里,我们还建立了参数估计的一致性。我们进行了数值研究,并将提出的方法应用于IRI营销数据,以研究店内展示营销效果。结果表明,该方法在识别子组和估计营销效果方面优于竞争方法。

MSC公司:

62第20页 统计学在经济学中的应用
62H30型 分类和区分;聚类分析(统计方面)
62C20个 统计决策理论中的Minimax过程

软件:

AS 136标准
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Austin,E.、Pan,W.和Shen,X.(2016)。一种新的半参数方法,用于通过融合使用惩罚回归的有限混合回归。中国统计局30,783-807·兹比尔1439.62168
[2] Boyd,S.、Parikh,N.、Chu,E.、Peleato,B.和Eckstein,J.(2011)。通过交替方向乘数法进行分布式优化和统计学习。已找到。趋势马赫数。学习。3, 1-122. ·Zbl 1229.90122号
[3] Bronnenberg,B.J.、Kruger,M.W.和Mela,C.F.(2008)。数据库文件-IRI营销数据集。作记号。科学。27, 745-748.
[4] Chi,E.C.和Lange,K.(2015)。凸聚类的分裂方法。J.Comp。图表。统计师。24, 994-1013.
[5] Coffey,N.、Hinde,J.和Holian,E.(2014年)。使用p-样条和混合效应模型对时间进程基因表达数据的纵向轮廓进行聚类。计算。统计数据分析。第71页,第14-29页·Zbl 1471.62045号
[6] Dempster,A.、Laird,N.和Rubin,D.(1977年)。通过EM算法从不完整数据中获得最大似然。J.R.统计社会服务。B.统计方法。39, 1-38. ·Zbl 0364.62022号
[7] Fahrmeir,L.和Kaufmann,H.(1986年)。离散响应模型中的渐近推理。统计师。巴普。27, 179-205. ·Zbl 0628.62057号
[8] Hartigan,J.A.和Wong,M.A.(1979年)。算法As 136:一种k-means聚类算法。J.R.统计社会服务。C.应用。统计数据28,100-108·Zbl 0447.62062号
[9] Hong,M.、Luo,Z.-Q.和Razaviyayn,M.(2016)。一类非凸问题交替方向乘子法的收敛性分析。SIAM优化杂志26,337-364·Zbl 1356.49061号
[10] Hubert,L.和Arabie,P.(1985)。比较分区。J.分类2193-218。
[11] Jaccard,P.(1912年)。高山区植物区系的分布。新植物醇。11, 37-50.
[12] Kruger,M.W.和Pagni,D.(2008)。IRI学术数据集描述。2.1版信息资源公司,芝加哥。
[13] Li,G.和Pong,T.K.(2015)。非凸组合优化分裂方法的全局收敛性。SIAM优化杂志25,2434-2460·Zbl 1330.90087号
[14] Liang,K.Y.和Zeger,S.L.(1986年)。使用广义线性模型进行纵向数据分析。生物特征73,13-22·Zbl 0595.62110号
[15] Luan,Y.和Li,H.(2003)。使用带有b样条的混合效应模型对时间进程基因表达数据进行聚类。生物信息学19,474-482。
[16] Ma,S.和Huang,J.(2016)。通过凹面融合评估亚组特异性治疗效果。arXiv预打印arXiv:1607.03717。
[17] Ma,S.和Huang,J.(2017)。用于子群分析的凹成对融合方法。《美国统计杂志》。协会112410-423。
[18] McNicholas,P.D.和Murphy,T.B.(2010年)。基于模型的纵向数据聚类。可以。《美国联邦法律大全》第38卷,第153-168页·Zbl 1190.62120号
[19] Ng,S.-K.,McLachlan,G.J.,Wang,K.,Ben-Tovim-Jones,L.和Ng,S-W.(2006)。带有随机效应成分的混合模型,用于聚类相关基因表达谱。生物信息学221745-1752。
[20] Pan,W.(2001)。广义估计方程中的Akaike信息准则。生物统计学57,120-125·Zbl 1210.62099号
[21] Pan,W.,Shen,X.和Liu,B.(2013)。聚类分析:通过非凸惩罚的有监督学习进行无监督学习。J.马赫。学习。1865-1889年第14号决议·Zbl 1317.68179号
[22] Rand,W.M.(1971)。评价聚类方法的客观标准。《美国统计杂志》。协会66,846-850。
[23] Wang,H.、Li,B.和Leng,C.(2009)。使用不同数量的参数选择收缩调整参数。J.R.统计社会服务。B.统计方法。71, 671-683. ·Zbl 1250.62036号
[24] Wang,Y.、Yin,W.和Zeng,J.(2015)。非凸非光滑优化中admm的全局收敛性。科学杂志。计算。78, 29-63. ·兹比尔1462.65072
[25] Wedel,M.和Kamakura,W.A.(2012年)。市场细分:概念和方法基础。第2版。Springer Science&Business Media,纽约。
[26] Zhang,C.H.(2010)。极小极大凹惩罚下的几乎无偏变量选择。安。统计师。38, 894-942. ·Zbl 1183.62120号
[27] Xiaolu Zhu Amazon.com,Inc.,207 Boren Ave N,Seattle,WA 98109,USA电子邮件:sarah.zhuxiaolu@gmail.com
[28] 曲安忆(Annie Qu)
[29] 美国加州大学欧文分校统计系唐纳德·布伦·霍尔2212。
[30] 电子邮件:aqu2@uci.edu(2018年7月收到;2019年5月接受)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。