克劳迪奥,匡瓦诺;杜塞尔多普,伊莉丝 通过logistic分类树干模拟阈值交互效应。 (英语) Zbl 1381.62160号 J、 经典。 34号,第3期,399-426(2017年). 摘要:我们介绍了一个处理二元响应数据中交互效应识别的模型,它集成了递归划分和广义线性模型。它源于一个特别的规范和随后的同步阈值交互建模算法(STIMA)的实现。该模型被称为Logistic分类树干模型,它允许我们通过同时估计主效应和阈值交互效应来获得回归参数。该模型的主要特点是,它允许用户评估一个唯一的模型,同时评估两个效果的重要性,这两个效果都是通过先生长一个分类主干,然后通过修剪来避免过度拟合而获得的。我们通过模拟研究探讨了一个合适的修剪参数的选择,并在25个二元响应数据集上比较了Logistic分类主干与13个替代模型/分类器的分类精度。 引用于1文件 理学硕士: 62小时30分 分类和区分;聚类分析(统计方面) 68T05型 人工智能中的学习与自适应系统 关键词:史提玛;广义线性模型;逻辑回归;递归分区;相互作用效应;回归树干 软件:核实验室;UCI毫升;巴蒂;电子状态学习;知识产权证书;插入符号;C50型;随机森林;阿普洛尔3;零件;质量(R);mlbench公司;巴特机器;阿达;丙二醛;C4.5款;加姆;R;贝伊斯特里;第四。数据 PDF格式 BibTeX公司 XML 引用 \texttit{C.Conversano}和\textti{E.Dusseldorp},J.Classif。34号,第3号,399--426(2017;Zbl 1381.62160) 全文: 内政部 开放URL 参考文献: [1] 艾伦,J;LE,H,logistic回归模型总体效应大小的附加测量,教育与行为统计杂志,33416-441,(2008) [2] 阿斯曼,旧金山;霍斯默,DW;LEMESHOW,S;MUNDT,KA,交互作用测量的置信区间,流行病学,7286-290,(1996) [3] BACHE,K.和LICHMAN,M.(2013),“UCI机器学习库”,加州大学欧文分校,信息与计算机科学学院,http://archive.ics.uci.edu/ml/。 [4] 巴利,何;SORENSON,BE,《计量经济学中的相互作用效应》,实证经济学,45583-603,(2013年) [5] 伯灵顿·德冈兹·莱兹,A;考克斯博士,《交互作用的解释:回顾》,《应用统计学年鉴》,1371-385,(2007)·Zbl 1416.62314号 [6] 布雷曼,L,装袋预测,机器学习,24123-140,(1996)·Zbl 0858.68080 [7] 布雷曼,L,随机森林,机器学习,45,5-32,(2001)·Zbl 1007.68152号 [8] BREIMAN,L.,FRIEDMAN,J.,OLSHEN,R.和STONE,C.(1984年),分类和回归树,加利福尼亚州蒙特利:沃兹沃斯和布鲁克斯·Zbl 0541.62042 [9] 奇普曼,哈;乔治,EI;MCCULLOCH,RE,Bart:贝叶斯加性回归树,《应用统计学年鉴》,4266-298,(2010)·Zbl 1189.62066 [10] COHEN,J.,COHEN,P.,WEST,S.和AIKEN,L.(2003年),行为科学中的应用多元回归/相关分析,新泽西州马华:劳伦斯·厄尔鲍姆。 [11] 卡尔普,M.,约翰逊,K.和米查利迪斯,G.(2012年),ada:随机Boosting的R包,R程序包版本2.0-3,http://CRAN.R-project.org/package=ada。 ·Zbl 0858.68080 [12] DAWSON,J.《管理研究的适度性:什么、为什么、何时和如何进行》,《商业与心理学杂志》,29,1-19,(2014) [13] DEMáAR,J,多数据集上分类器的统计比较,机器学习研究杂志,7,1-30,(2006)·Zbl 1222.68184 [14] 杜塞尔多普E;CONVERSANO,C;VAN OS,BJ,同时结合加法和基于树的回归模型:stima,计算和图形统计杂志,19514-530,(2010) [15] FLEMING,T.和HARRINGTON,D.(1991年),计数过程与生存分析,新泽西州霍博肯:约翰威利父子公司·Zbl 0727.62096 [16] 《多元自适应回归样条曲线》,《统计年鉴》,19,1-67,(1991)·Zbl 0765.62064 [17] 弗里德曼,JH;黑斯蒂,T;TIBSHIRANI,R,加性逻辑回归:boosting的统计观点,统计年鉴,28337-374,(2000)·Zbl 1106.62323 [18] GRUBINGER,T.,ZEILEIS,A.和PFEIFFER,K.P.(2011),“R中全局最优分类和回归树的进化学习”,工作论文2011-20。经济学和统计学工作论文,实证和实验经济学研究平台,因斯布鲁克大学,http://EconPapers.RePEc.org/RePEc:inn:wpaper:2011-20。 [19] HALVORSEN,T.(2012年),“ElemStatLearn:数据集、函数和示例”,in统计学习、数据挖掘、推理和预测的要素T.Hastie、R.Tibshirani和J.Friedman,R软件包版本2012.04-0,http://CRAN.R-project.org/package=ElemStatLearn。 [20] 汉德,D.J.(1997年),分类规则的构建与评估,奇切斯特:威利·Zbl 0997.62500 [21] HASTIE,T.J.,FRIEDMAN,J.H.,和TIBSHIRANI,R.J.(2009年),统计学习要素,纽约:斯普林格·Zbl 1273.62005 [22] HASTIE,T.J.,和TIBSHIRANI,R.J.(1990年),广义加法模型,伦敦:查普曼和霍尔·Zbl 0747.62061 [23] HASTIE,T.(2013年),广义加性模型,R程序包版本1.09,http://CRAN.R-project.org/package=gam。 [24] HASTIE,T.和TIBSHIRANI,R.(2013年),mda:混合与柔性判别分析,R包0.4-4版,S原创,Hastie和Tishirani原创,Risch、Hornik和Ripley原创R port,http://CRAN.R-project.org/package=mda。 [25] 霍特霍恩,T;霍尼克,K;ZEILEIS,A,无偏递归划分:条件推理框架,计算与图形统计杂志,15651-674,(2006) [26] HOSMER,D.W.,LEMESHOW,S.,和STURDIVANT,R.X.(2013年),应用逻辑回归(第三版),新泽西州霍博肯:约翰威利父子公司·Zbl 1276.62050 [27] HOSMER,D.W.,和LEMESHOW,S.(2000年),应用逻辑回归(第二版),霍博肯新泽西州:约翰威利父子公司·Zbl 0967.62045 [28] HOSMER,D.W.,和LEMESHOW,S.(1989年),应用逻辑回归(第1版),霍博肯新泽西州:约翰威利父子公司·Zbl 0967.62045 [29] HOTHORN,T.(2014),“TH.Data:TH的数据存档”,R包版本1.0-3,http://CRAN.R-project.org/package=TH.data。 [30] KALBFLEISCH,J.D.,和PRENTICE,R.L.(1980年),失效时间数据的统计分析,纽约:约翰威利和儿子·Zbl 0504.62096 [31] KAPELNER,A.和BLEICH,J.(2013年),“bartMachine:机器学习的强大工具”,ArXiv电子打印, http://arxiv.org/abs/1312.2171。 ·Zbl 1416.62314号 [32] 卡拉佐格鲁,A;迈耶,D;HORNIK,K,R中的支持向量机,统计软件杂志,15,1-28,(2006) [33] 卡拉佐格鲁,A;斯莫拉,A;霍尼克,K;ZEILEIS,A,Kernlab—R中内核方法的S4包,统计软件杂志,11,1-20,(2004) [34] 金,H;LOH,W,无偏多向分割的分类树,美国统计协会杂志,96589-604,(2001) [35] KUHN,A.【J.Wing、S.Weston、A.Williams、C.Keefer、A.Engelhardt、T.Cooper、Z.Mayer和R核心团队的贡献](2014年),“caret:分类和回归培训。R包版本6.0-30”,http://CRAN.R-project.org/package=caret。 [36] KUHN,M.,WESTON,S.和COULTER,N.(2014年),“C50:C5.0决策树和基于规则的模型”,R程序包版本0.1.0-19,(R.Quinlan为C5.0编写的C代码),http://CRAN.R-project.org/package=C50。 [37] 兰德维尔,N;霍尔,M;FRANK,E,逻辑模型树,机器学习,59161-205,(2005)·Zbl 1101.68767 [38] LEISCH,F.和DIMITRIADU,E.(2010年),“mlbench:机器学习基准问题”,R程序包版本2.1-1,http://CRAN.R-project.org/package=mlbench。 [39] LIAW,A;《随机森林分类与回归》,R News,2,18-22,(2002) [40] LOH,W-Y,提高分类树的精度,应用统计学年鉴,31710-1737,(2009)·Zbl 1184.62109 [41] 洛,W-Y;石英云,分类树的分割选择方法,统计,7815-840,(1997)·Zbl 1067.62545 [42] MCCULLAGH,P.和NELDER,J.A.(1989年),广义线性模型,伦敦:查普曼和霍尔·Zbl 0744.62098 [43] 《城市出行需求的计量》,公共经济学杂志,303-328,(1974) [44] 梅纳德,S,多元logistic回归分析的决定系数,美国统计学家,54,17-24,(2000) [45] 摩根,JN;SONQUIST,JA,《调查数据分析中的问题及建议》,美国统计协会期刊,58415-434,(1963)·京保0114.10103 [46] 斯考比特:logit和probit的另一种估计方法,美国政治科学杂志,38230-255,(1993) [47] 内尔德,JA;韦德伯恩,RWM,广义线性模型,皇家统计学会杂志,A系列,135370-384,(1972) [48] PETERS,A.和HOTHORN,T.(2013年),“ipred:改进的预测因子”,R软件包版本0.9-3,http://CRAN.R-project.org/package=ipred。 ·Zbl 1007.68152号 [49] 昆兰,J.R.(1993年),C4.5:机器学习程序,加州圣弗朗西索:摩根考夫曼出版公司。 [50] R核心团队(2016年),R: 统计计算语言和环境统计计算基金会,奥地利维也纳。 [51] RIPLEY,B.D.(1996年),模式识别与神经网络,纽约:剑桥大学出版社·Zbl 0853.62046 [52] RUSCH,T;李,我;霍尼克,K;张伟;ZEILEIS,A,《用统计影响选举:用逻辑回归树锁定选民》,《应用统计学年鉴》,71612-1639,(2013)·Zbl 1454.62505 [53] THERNEAU,T.,ATKINSON,B.和RIPLEY,B.D.(2014年)。rpart:递归分区和回归树. R程序包版本4.1-5,http://CRAN.R-project.org/package=rpart。 [54] VENABLES,W.N.和RIPLEY,B.D.(2002年)现代应用统计学,纽约:斯普林格·Zbl 1006.62003 [55] WITTEN,I.H.和FRANK,E.(2005年),数据挖掘:实用的机器学习工具和技术,加利福尼亚州旧金山:摩根考夫曼·Zbl 1076.68555 [56] 泽利斯,A;霍特霍恩,T;HORNIK,K,基于模型的递归划分,计算与图形统计杂志,17492-514,(2008) 此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。