×

用统计数据影响选举:用逻辑回归树瞄准选民。 (英语) Zbl 1454.62505号

摘要:在政治竞选中,大量资源用于选民动员,即确定和影响尽可能多的人投票。竞选活动使用统计工具来决定目标人群(“微目标”)。本文以2004年美国总统大选为例,描述了一场旨在提高总投票率的无党派运动。基于俄亥俄州19634名合格选民的真实数据集,我们引入了一个现代统计框架,该框架非常适合在一次扫描中执行选民目标定位的主要任务:预测个人因特定原因、政党或候选人的投票率(或支持率)可能性,以及数据驱动的选民细分。我们的框架,我们称之为LORET(LOLogistic回归树),包含标准方法,如逻辑回归和分类树,作为特殊情况,并允许综合这两种技术。在我们的案例研究中,我们探索了各种LORET模型,在逻辑模型组件中使用不同的回归变量,在树组件中使用了不同的划分变量;我们根据它们的预测准确性对它们进行分析,并比较使用完整的可用变量集与仅使用有限数量的信息的效果。我们发现,用额外的预测变量(如党派关系方面的家庭构成)增加一组标准变量(如年龄和投票历史)明显提高了预测准确性。我们还发现,基于树归纳的LORET模型优于未划分的模型。此外,我们还说明了选民细分是如何从我们的框架中产生的,并从目标的角度讨论了产生的概况。

MSC公司:

62第25页 统计学在社会科学中的应用
62H30型 分类和区分;聚类分析(统计方面)
62J12型 广义线性模型(逻辑模型)
62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Albert,A.和Anderson,J.A.(1984年)。关于logistic回归模型中极大似然估计的存在性。生物特征71 1-10·兹伯利0543.62020 ·doi:10.1093/biomet/71.1.1
[2] Arceneaux,K.和Nickerson,D.W.(2009年)。谁被动员投票?11项野外实验的再分析。美国政治科学杂志53 1-16。
[3] Blumenthal,M.(2012年)。奥巴马竞选民意调查:内部数据是如何做到这一点的。《赫芬顿邮报》。可从[访问日期:2012-12-09]获取。
[4] Breiman,L.、Friedman,J.H.、Olsen,R.A.和Stone,C.J.(1984)。分类和回归树。加利福尼亚州太平洋格罗夫沃兹沃斯·Zbl 0541.62042号
[5] Cardy,E.A.(2005)。一项实验性的实地研究和党派直接邮件和电话的说服效果。美国政治和社会科学院年鉴601 28-40。
[6] Chan,K.-Y.和Loh,W.-Y..(2004年)。LOTUS:一种构建精确且可理解的逻辑回归树的算法。J.计算。图表。统计师。13 826-852. ·doi:10.1198/106186004X13064
[7] Chaudhuri,P.、Lo,W.D.、Loh,W.Y.和Yang,C.C.(1995年)。广义回归树。统计师。中国5 641-666·兹伯利0824.62060
[8] Chipman,H.A.、George,E.I.和McCulloch,R.E.(2010年)。BART:贝叶斯加性回归树。附录申请。统计数据4 266-298·Zbl 1189.62066号 ·doi:10.1214/09-AOAS285
[9] Cutts,D.和Fieldhouse,E.(2009年)。哪些小的空间尺度与个人选民的选举环境相关?家庭在2001年大选投票率上的重要性。美国政治科学杂志53 726-739。
[10] Denny,K.和Doyle,O.(2009年)。投票历史重要吗?分析投票率的持续性。美国政治科学杂志53 17-35。
[11] Finkel,S.(1993)。重新审视最近总统选举中的“最小影响”模式。《政治杂志》55 1-21。
[12] Gerber,A.S.和Green,D.P.(2000a)。无党派外出运动的效果:传单的实验研究。《政治杂志》62 846-857。
[13] Gerber,A.S.和Green,D.P.(2000b)。拉票、电话和直邮对选民投票率的影响:一项实地实验。《美国政治科学评论》94 656-664。
[14] Gerber,A.S.、Green,D.P.和Green,M.(2007)。党派邮件和选民投票率:来自随机现场实验的结果。选举研究22 563-579。
[15] Goldstein,K.和Ridout,T.N.(2002)。参与政治:随着时间的推移,动员和投票率。政治行为24 3-29。
[16] Green,D.P.、Gerber,A.S.和Nickerson,D.W.(2003)。在地方选举中赢得选票:六次挨家挨户拉票实验的结果。《政治杂志》65 1083-1096。
[17] Green,D.P.和Gerber,A.S.(2008)。《退出投票:如何增加选民投票率》,布鲁金斯学会第二版,华盛顿特区。
[18] Green,D.P.和Kern,H.L.(2012)。用贝叶斯加性回归树模拟调查实验中的异质处理效应。《民意季刊》76 491-511。
[19] Hansen,B.B.和Bowers,J.(2009年)。将影响归因于集群随机的“走出去”运动。J.Amer。统计师。协会104 873-885·Zbl 1388.62185号 ·doi:10.1198/jasa.2009.ap06589
[20] Hastie,T.、Tibshirani,R.和Friedman,J.(2009)。《统计学习的要素:数据挖掘、推断和预测》,第二版,纽约斯普林格出版社·Zbl 1273.62005年
[21] Holbrook,T.M.和McClurg,S.D.(2005)。核心支持者的动员:美国总统选举中的竞选活动、投票率和选举构成。美国政治科学杂志49 689-703。
[22] Hothorn,T.、Bretz,F.和Westfall,P.(2008)。一般参数模型中的同时推理。生物。期刊50 346-363·兹比尔1147.62355 ·doi:10.1002/bimj.200810425
[23] Hothorn,T.、Hornik,K.和Zeileis,A.(2006年)。《无偏递归分区:条件推理框架》,J.Compute。图表。统计师。15 651-674. ·doi:10.1198/106186006X133933
[24] Hothorn,T.、Leisch,F.、Zeileis,A.和Hornik,K.(2005年)。基准实验的设计和分析。J.计算。图表。统计师。14 675-699. ·doi:10.1198/106186005X59630
[25] Imai,K.和Strauss,A.(2011年)。根据随机实验评估异质治疗效果,并应用于“走出去”运动的最佳规划。政治分析19 1-19。
[26] Issenberg,S.(2012年a)。奥巴马的白鲸:竞选团队的绝密项目“独角鲸”将如何改变这场比赛,以及未来的许多比赛。板岩。可从[访问日期:2012-12-04]获取。
[27] Issenberg,S.(2012年b)。胜利实验室:胜利运动的秘密科学。纽约皇冠出版社。
[28] Karp,J.A.和Banducci,S.A.(2007年)。新旧民主国家的政党动员和政治参与。政党政治13 217-234。
[29] 卡普,J.A.,班杜奇,S.A.和鲍勒,S.(2008)。投票:比较视野中的政党动员。英国政治科学杂志38 91-112。
[30] Kass,G.V.(1980)。用于调查大量分类数据的探索性技术。J.R.统计社会服务。C.申请。统计数据29 119-127。
[31] Landwehr,N.、Hall,M.和Eibe,F.(2005)。物流模型树。机器学习59 161-205·Zbl 1101.68767号 ·doi:10.1007/s10994-005-0466-3
[32] Loh,W.-Y.和Shih,Y.-S.(1997)。分类树的拆分选择方法。统计师。Sinica 7 815-840·Zbl 1067.62545号
[33] Malchow,H.(2008)。政治目标,第二版,预测名单有限责任公司,加利福尼亚州萨克拉门托。
[34] McCullagh,P.和Nelder,J.A.(1989)。广义线性模型,第二版,查普曼和霍尔,纽约·Zbl 0744.62098号
[35] McDonald,M.(2012)。1980-2010年的投票率。美国选举项目。可从[访问日期:2012-02-16]获取。
[36] Muller,M.G.(1999)。竞选作为一种职业美国政治顾问的职业化。《维也纳政治》40 198-199。
[37] Murray,G.R.和Scime,A.(2010年)。微观目标和选民细分:美国全国选举研究的数据挖掘。《政治营销杂志》9 143-166。
[38] Nickerson,D.W.、Friedrichs,R.D.和King,D.C.(2006年)。该领域的党派动员运动:密歇根州全州投票率实验的结果。《政治研究季刊》59 85-97。
[39] Panagopoulos,C.(2009年)。党派和无党派信息内容和选民动员现场实验证据。《政治研究季刊》62 70-76。
[40] Parry,J.、Barth,J.,Kropf,M.和Jones,E.T.(2008)。动员很少的选民:竞选接触和在高调选举中的影响。政治行为30 97-113。
[41] Phillips,J.M.、Urbany,J.E.和Reynolds,T.J.(2008)。验证和效价政治广告的效果:一项现场实验。消费者研究杂志34 794-806。
[42] 普莱瑟,F.(2000)。美国在世界各地的竞选技巧。《哈佛国际新闻政治杂志》5 33-54。
[43] Quinlan,J.R.(1993)。C 4。5:机器学习程序。Morgan Kaufmann,加利福尼亚州圣马特奥。
[44] R开发核心团队(2012年)。R: 用于统计计算的语言和环境。R统计计算基金会,奥地利维也纳。
[45] Rusch,T.和Zeileis,A.(2013年)。通过广义线性模型的递归划分获得洞察力。J.统计计算。模拟。83 1301-1315.
[46] Rusch,T.、Zeileis,A.、Hothorn,T.和Leisch,F.(2012年)。mobtools:用于扩展mob的统计模型和实用程序的集合。R包版本0.0-1。
[47] Rusch,T.、Lee,I.、Hornik,K.、Jank,W.和Zeileis,A.(2013a)。补充“用统计数据影响选举:用逻辑回归树确定选民”·Zbl 1454.62505号
[48] Rusch,T.、Lee,I.、Hornik,K.、Jank,W.和Zeileis,A.(2013b)。补充“用统计数据影响选举:用逻辑回归树确定选民”·Zbl 1454.62505号
[49] Sing,T.、Sander,O.、Beerenwinkel,N.和Lengauer,T.(2005)。ROCR:R生物信息学中分类器性能的可视化21 3940-3941。
[50] Sing,T.、Sander,O.、Beerenwinkel,N.和Lengauer,T.(2009)。ROCR:可视化评分分类器的性能。R软件包版本1.0-4。
[51] Susan,J.C.(1999)。性别差距的丧失:足球妈妈和1996年的选举。PS:政治科学与政治32 7-11。
[52] Sussman,G.和Galizio,L.(2003)。美国政治的全球复制。政治沟通20 309-328。
[53] Therneau,T.M.和Atkinson,E.J.(1997)。介绍使用rpart例程的递归分区。技术报告61,生物统计科,纽约州罗切斯特梅奥诊所。
[54] Therneau,T.M.、Atkinson,E.J.和Ripley,B.D.(2011年)。rpart:递归分区。R软件包版本3.1-50。
[55] 美国选举援助委员会(2010年)。1993年《全国选民登记法》对2009-2010年联邦办公室选举管理的影响。
[56] 怀特洛克·A、怀特洛克·J和范·海尔德·J(2010)。促销活动和不同选举制度对选民投票率的影响:对英国和德国欧洲选举的研究。欧洲市场营销杂志44 401-420。
[57] Wielhouwer,P.W.(2003)。寻找林肯在草根运动中的完美列表。美国政治研究31 632-669。
[58] 维基百科(2012)。2012年美国总统选举。可从[访问日期:2012-11-21]获取。
[59] Wilcoxon,F.(1945年)。通过排名方法进行个人比较。生物统计公报1 80-83。
[60] Zeileis,A.、Hothorn,T.和Hornik,K.(2008)。基于模型的递归分区。J.计算。图表。统计师。17 492-514. ·doi:10.1198/106186008X319331
[61] Zhang,H.和Singer,B.H.(2010)。递归分区和应用,第二版,Springer,纽约·Zbl 1271.62016年
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。