×

通过后勤分类主干模拟阈值交互效应。 (英语) Zbl 1381.62160号

摘要:我们介绍了一个识别二进制响应数据中交互效应的模型,该模型集成了递归划分和广义线性模型。它源于一个特殊规范和同步阈值交互建模算法(STIMA)的后续实现。该模型称为Logistic Classification Trunk,它允许我们通过同时估计主效应和阈值交互效应,以最大似然获得回归参数。该模型的主要特征是,它允许用户评估一个独特的模型,同时评估两种效果的重要性,这两种效果是通过首先生长分类主干,然后修剪它以避免过度拟合而获得的。我们通过仿真研究研究了合适的剪枝参数的选择,并在25个二进制响应数据集上比较了Logistic分类主干和13个备选模型/分类器的分类精度。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] ALLEN,J.和LE,H.(2008),“Logistic回归模型总体效应大小的额外测量”,《教育与行为统计杂志》,33(4),416-441·数字对象标识代码:10.3102/1076998607306081
[2] ASSMANN,S.F.、HOSMER,D.W.、LEMESHOW,S.和MUNDT,K.A.(1996),“交互作用度量的置信区间”,流行病学,7(3),286-290·doi:10.1097/00001648-199605000-00012
[3] BACHE,K.和LICHMAN,M.(2013),“UCI机器学习库”,加利福尼亚大学欧文分校信息与计算机科学学院,http://archive.ics.uci.edu/ml/。
[4] BALLI,H.O.和SORENSON,B.E.(2013),“计量经济学中的相互作用效应”,实证经济学,45,583-603·doi:10.1007/s00181-012-0604-2
[5] BERRINGTON DE GONZáLEZ,A.和COX,D.R.(2007),“相互作用的解释:综述”,《应用统计学年鉴》,1(2),371-385·兹比尔1416.62314 ·doi:10.1214/07-AOAS124
[6] BREIMAN,L.(1996),“打包预测”,机器学习,24(2),123-140·Zbl 0858.68080号
[7] BREIMAN,L.(2001),“随机森林”,机器学习,45(1),5-32·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[8] BREIMAN,L.、FRIEDMAN,J.、OLSHEN,R.和STONE,C.(1984),分类和回归树,加利福尼亚州蒙特利:沃兹沃思和布鲁克斯·Zbl 0541.62042号
[9] CHIPMAN,H.A.、GEORGE,E.I.和MCCULLOCH,R.E.(2010),“巴特:贝叶斯加性回归树”,《应用统计学年鉴》,第4(1)期,第266-298页·Zbl 1189.62066号 ·doi:10.1214/09-AOAS285
[10] COHEN,J.、COHEN,P.、WEST,S.和AIKEN,L.(2003),《行为科学的应用多元回归/相关分析》,新泽西州马瓦赫:劳伦斯·埃尔鲍姆。
[11] CULP,M.、JOHNSON,K.和MICHAILIDIS,G.(2012),ada:随机升压的R包,R包版本2.0-3,http://CRAN.R-project.org/package=ada。 ·Zbl 0858.68080号
[12] DAWSON,J.(2014),“管理研究的适度性:什么、为什么、何时以及如何”,《商业与心理学杂志》,29(1),1-19·doi:10.1007/s10869-013-9308-7
[13] DEMŠAR,J.(2006),“多数据集分类器的统计比较”,《机器学习研究杂志》,第7期,第1-30页·Zbl 1222.68184号
[14] DUSSELDORP,E.、CONVERSANO,C.和VAN OS,B.J.(2010年),“同时结合加法和基于树的回归模型:Stima”,《计算与图形统计杂志》,19(3),514-530·doi:10.1198/jcgs.2010.06089
[15] FLEMING,T.和HARRINGTON,D.(1991),计数过程和生存分析,新泽西州霍博肯:John Wiley and Sons,Inc·Zbl 0727.62096号
[16] 弗里德曼,J.H.(1991),“多元自适应回归样条”,《统计学年鉴》,19(1),1-67·Zbl 0765.62064号 ·doi:10.1214/aos/1176347963
[17] FRIEDMAN,J.H.、HASTIE,T.和TIBSHIRANI,R.(2000),“加性逻辑回归:提升的统计观点”,《统计年鉴》,28(2),337-374·兹比尔1106.62323 ·doi:10.1214/aos/1016218223
[18] GRUBINGER,T.、ZEILEIS,A.和PFEIFFER,K.P.(2011),“R中全局最优分类和回归树的进化学习”,工作文件2011-20。因斯布鲁克大学经济学和统计学工作论文,实证和实验经济学研究平台,http://EconPapers.RePEc.org/RePEc:inn:wpaper:2011-20.
[19] HALVORSEN,T.(2012),“ElemStatLearn:数据集、函数和示例”,载于《统计学习、数据挖掘、推断和预测的要素》,T.Hastie,R.Tibshirani和J.Friedman,R包版本2012.04-0,http://CRAN.R-project.org/package=ElemStatLearn。
[20] HAND,D.J.(1997),《分类规则的构建和评估》,奇切斯特:威利出版社·Zbl 0997.62500号
[21] HASTIE,T.J.、FRIEDMAN,J.H.和TIBSHIRANI,R.J.(2009),《统计学习要素》,纽约:施普林格出版社·Zbl 1273.62005年 ·doi:10.1007/978-0-387-84858-7
[22] HASTIE,T.J.和TIBSHIRANI,R.J.(1990),广义可加模型,伦敦:查普曼和霍尔出版社·Zbl 0747.62061号
[23] HASTIE,T.(2013),gam:广义加法模型,R包版本1.09,http://CRAN.R-project.org/package=gam。
[24] HASTIE,T.和TIBSHIRANI,R.(2013),mda:混合和灵活判别分析,R包版本0.4-4,HASTIE和Tishirani原创S,Leich、Hornik和Ripley原创R端口,http://CRAN.R-project.org/package=mda。
[25] HOTHORN,T.、HORNIK,K.和ZEILEIS,A.(2006),“无偏递归划分:条件推理框架”,《计算与图形统计杂志》,15(3),651-674·doi:10.1198/106186006X133933
[26] HOSMER,D.W.、LEMESHOW,S.和STURDIVANT,R.X.(2013),应用逻辑回归(第三版),新泽西州霍博肯:John Wiley and Sons,Inc·Zbl 1276.62050号
[27] HOSMER,D.W.和LEMESHOW,S.(2000),应用逻辑回归(第二版),新泽西州霍博肯:John Wiley and Sons,Inc·Zbl 0967.62045号
[28] HOSMER,D.W.和LEMESHOW,S.(1989),应用逻辑回归(第1版),新泽西州霍博肯:John Wiley and Sons,Inc·Zbl 0967.62045号
[29] HOTHORN,T.(2014),“TH.数据:TH的数据档案”,R包版本1.0-3,http://CRAN.R-project.org/package=TH.data。
[30] KALBFLEISCH,J.D.和PRENTICE,R.L.(1980),《故障时间数据的统计分析》,纽约:John Wiley and Sons·Zbl 0504.62096号
[31] KAPELNER,A.和BLEICH,J.(2013),“bartMachine:机器学习的强大工具”,ArXiv电子版,http://arxiv.org/abs/1312.2171。 ·Zbl 1416.62314号
[32] KARATZOGLOU,A.、MEYER,D.和HORNIK,K.(2006),“R中的支持向量机”,《统计软件杂志》,15(9),1-28·doi:10.18637/jss.v015.2009
[33] KARATZOGLOU,A.、SMOLA,A.、HORNIK,K.和ZEILEIS,A.(2004),“kernalab-R中内核方法的S4包”,《统计软件杂志》,11(9),1-20·doi:10.18637/jss.v011.i09
[34] KIM,H.和LOH,W.(2001),“无偏多路分裂的分类树”,《美国统计协会杂志》,96589-604·doi:10.1198/016214501753168271
[35] KUHN,A.【J.Wing、S.Weston、A.Williams、C.Keefer、A.Engelhardt、T.Cooper、Z.Mayer和R核心团队的贡献】(2014),“插入符号:分类和回归训练.R包版本6.0-30”,http://CRAN.R-project.org/package=插入符号。
[36] KUHN,M.、WESTON,S.和COULTER,N.(2014),“C50:C5.0决策树和基于规则的模型”,R包版本0.1.0-19,(R.Quinlan编写的C5.0的C代码),http://CRAN.R-project.org/package=C50。
[37] LANDWEHR,N.、HALL,M.和FRANK,E.(2005),“逻辑模型树”,机器学习,59(1-2),161-205·Zbl 1101.68767号 ·doi:10.1007/s10994-05-0466-3
[38] LEISCH,F.和DIMITRIADU,E.(2010),“mlbench:机器学习基准问题”,R包版本2.1-1,http://CRAN.R-project.org/package=mlbench。
[39] LIAW,A.和WIENER,M.(2002),“随机森林分类和回归”,R News,2(3),18-22。
[40] LOH,W.-Y.(2009),“提高分类树的精度”,《应用统计年鉴》,3(4),1710-1737·Zbl 1184.62109号 ·doi:10.1214/09-AOAS260
[41] LOH,W.-Y.和SHIH,Y.-S.(1997),“分类树的分割选择方法”,《统计》,7(4),815-840·Zbl 1067.62545号
[42] MCCULLAGH,P.和NELDER,J.A.(1989),广义线性模型,伦敦:查普曼和霍尔出版社·Zbl 0744.62098号 ·doi:10.1007/9781-4899-3242-6
[43] MCFADDEN,D.(1974),“城市出行需求的测量”,《公共经济学杂志》,3(4),303-328·doi:10.1016/0047-2727(74)90003-6
[44] MENARD,S.(2000),“多元Logistic回归分析的决定系数”,《美国统计学家》,54(1),17-24。
[45] MORGAN,J.N.和SONQUIST,J.A.(1963),“调查数据分析中的问题和建议”,《美国统计协会杂志》,58(302),415-434·Zbl 0114.10103中 ·网址:10.1080/01621459.1963.10500855
[46] NAGLER,J.(1993),“斯科比特:Logit和Probit的替代估计量”,《美国政治科学杂志》,38(1),230-255·doi:10.2307/211343
[47] NELDER,J.A.和WEDDERBURN,R.W.M.(1972),“广义线性模型”,《皇家统计学会杂志》,A辑,135,370-384·doi:10.2307/2344614
[48] PETERS,A.和HOTHORN,T.(2013),“ipred:改进的预测值”,R包版本0.9-3,http://CRAN.R-project.org/package=ipred。 ·Zbl 1007.68152号
[49] QUINLAN,J.R.(1993),C4.5:机器学习课程,加利福尼亚州旧金山:摩根考夫曼出版社。
[50] R CORE TEAM(2016),R:统计计算的语言和环境,R统计计算基金会,奥地利维也纳。
[51] RIPLEY,B.D.(1996),模式识别和神经网络,纽约:剑桥大学出版社·Zbl 0853.62046号
[52] RUSCH,T.,LEE,I.,HORNIK,K.,JANK,W.和ZEILEIS,A.(2013),“用统计影响选举:用逻辑回归树瞄准选民”,《应用统计年鉴》,7(3),1612-1639·Zbl 1454.62505号 ·doi:10.1214/13-AOAS648
[53] THERNEAU,T.、ATKINSON,B.和RIPLEY,B.D.(2014年)。rpart:递归分区和回归树。R包版本4.1-5,http://CRAN.R-project.org/package=rpart。
[54] 韦纳布尔斯,W.N.和RIPLEY,B.D.(2002)《现代应用统计与S》,纽约:斯普林格出版社·Zbl 1006.62003号 ·doi:10.1007/978-0-387-21706-2
[55] WITTEN,I.H.和FRANK,E.(2005),《数据挖掘:实用机器学习工具和技术》,加利福尼亚州旧金山:Morgan Kaufmann·Zbl 1076.68555号
[56] ZEILEIS,A.、HOTHORN,T.和HORNIK,K.(2008),“基于模型的递归分区”,《计算与图形统计杂志》,17(2),492-514·doi:10.1198/106186008X319331
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。