×

通过logistic分类树干模拟阈值交互效应。 (英语) Zbl 1381.62160号

摘要:我们介绍了一个处理二元响应数据中交互效应识别的模型,它集成了递归划分和广义线性模型。它源于一个特别的规范和随后的同步阈值交互建模算法(STIMA)的实现。该模型被称为Logistic分类树干模型,它允许我们通过同时估计主效应和阈值交互效应来获得回归参数。该模型的主要特点是,它允许用户评估一个唯一的模型,同时评估两个效果的重要性,这两个效果都是通过先生长一个分类主干,然后通过修剪来避免过度拟合而获得的。我们通过模拟研究探讨了一个合适的修剪参数的选择,并在25个二元响应数据集上比较了Logistic分类主干与13个替代模型/分类器的分类精度。

理学硕士:

62小时30分 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习与自适应系统
PDF格式 BibTeX公司 XML 引用
全文: 内政部

参考文献:

[1] 艾伦,J;LE,H,logistic回归模型总体效应大小的附加测量,教育与行为统计杂志,33416-441,(2008)
[2] 阿斯曼,旧金山;霍斯默,DW;LEMESHOW,S;MUNDT,KA,交互作用测量的置信区间,流行病学,7286-290,(1996)
[3] BACHE,K.和LICHMAN,M.(2013),“UCI机器学习库”,加州大学欧文分校,信息与计算机科学学院,http://archive.ics.uci.edu/ml/。
[4] 巴利,何;SORENSON,BE,《计量经济学中的相互作用效应》,实证经济学,45583-603,(2013年)
[5] 伯灵顿·德冈兹·莱兹,A;考克斯博士,《交互作用的解释:回顾》,《应用统计学年鉴》,1371-385,(2007)·Zbl 1416.62314号
[6] 布雷曼,L,装袋预测,机器学习,24123-140,(1996)·Zbl 0858.68080
[7] 布雷曼,L,随机森林,机器学习,45,5-32,(2001)·Zbl 1007.68152号
[8] BREIMAN,L.,FRIEDMAN,J.,OLSHEN,R.和STONE,C.(1984年),分类和回归树,加利福尼亚州蒙特利:沃兹沃斯和布鲁克斯·Zbl 0541.62042
[9] 奇普曼,哈;乔治,EI;MCCULLOCH,RE,Bart:贝叶斯加性回归树,《应用统计学年鉴》,4266-298,(2010)·Zbl 1189.62066
[10] COHEN,J.,COHEN,P.,WEST,S.和AIKEN,L.(2003年),行为科学中的应用多元回归/相关分析,新泽西州马华:劳伦斯·厄尔鲍姆。
[11] 卡尔普,M.,约翰逊,K.和米查利迪斯,G.(2012年),ada:随机Boosting的R包,R程序包版本2.0-3,http://CRAN.R-project.org/package=ada。 ·Zbl 0858.68080
[12] DAWSON,J.《管理研究的适度性:什么、为什么、何时和如何进行》,《商业与心理学杂志》,29,1-19,(2014)
[13] DEMáAR,J,多数据集上分类器的统计比较,机器学习研究杂志,7,1-30,(2006)·Zbl 1222.68184
[14] 杜塞尔多普E;CONVERSANO,C;VAN OS,BJ,同时结合加法和基于树的回归模型:stima,计算和图形统计杂志,19514-530,(2010)
[15] FLEMING,T.和HARRINGTON,D.(1991年),计数过程与生存分析,新泽西州霍博肯:约翰威利父子公司·Zbl 0727.62096
[16] 《多元自适应回归样条曲线》,《统计年鉴》,19,1-67,(1991)·Zbl 0765.62064
[17] 弗里德曼,JH;黑斯蒂,T;TIBSHIRANI,R,加性逻辑回归:boosting的统计观点,统计年鉴,28337-374,(2000)·Zbl 1106.62323
[18] GRUBINGER,T.,ZEILEIS,A.和PFEIFFER,K.P.(2011),“R中全局最优分类和回归树的进化学习”,工作论文2011-20。经济学和统计学工作论文,实证和实验经济学研究平台,因斯布鲁克大学,http://EconPapers.RePEc.org/RePEc:inn:wpaper:2011-20。
[19] HALVORSEN,T.(2012年),“ElemStatLearn:数据集、函数和示例”,in统计学习、数据挖掘、推理和预测的要素T.Hastie、R.Tibshirani和J.Friedman,R软件包版本2012.04-0,http://CRAN.R-project.org/package=ElemStatLearn。
[20] 汉德,D.J.(1997年),分类规则的构建与评估,奇切斯特:威利·Zbl 0997.62500
[21] HASTIE,T.J.,FRIEDMAN,J.H.,和TIBSHIRANI,R.J.(2009年),统计学习要素,纽约:斯普林格·Zbl 1273.62005
[22] HASTIE,T.J.,和TIBSHIRANI,R.J.(1990年),广义加法模型,伦敦:查普曼和霍尔·Zbl 0747.62061
[23] HASTIE,T.(2013年),广义加性模型,R程序包版本1.09,http://CRAN.R-project.org/package=gam。
[24] HASTIE,T.和TIBSHIRANI,R.(2013年),mda:混合与柔性判别分析,R包0.4-4版,S原创,Hastie和Tishirani原创,Risch、Hornik和Ripley原创R port,http://CRAN.R-project.org/package=mda。
[25] 霍特霍恩,T;霍尼克,K;ZEILEIS,A,无偏递归划分:条件推理框架,计算与图形统计杂志,15651-674,(2006)
[26] HOSMER,D.W.,LEMESHOW,S.,和STURDIVANT,R.X.(2013年),应用逻辑回归(第三版),新泽西州霍博肯:约翰威利父子公司·Zbl 1276.62050
[27] HOSMER,D.W.,和LEMESHOW,S.(2000年),应用逻辑回归(第二版),霍博肯新泽西州:约翰威利父子公司·Zbl 0967.62045
[28] HOSMER,D.W.,和LEMESHOW,S.(1989年),应用逻辑回归(第1版),霍博肯新泽西州:约翰威利父子公司·Zbl 0967.62045
[29] HOTHORN,T.(2014),“TH.Data:TH的数据存档”,R包版本1.0-3,http://CRAN.R-project.org/package=TH.data。
[30] KALBFLEISCH,J.D.,和PRENTICE,R.L.(1980年),失效时间数据的统计分析,纽约:约翰威利和儿子·Zbl 0504.62096
[31] KAPELNER,A.和BLEICH,J.(2013年),“bartMachine:机器学习的强大工具”,ArXiv电子打印, http://arxiv.org/abs/1312.2171。 ·Zbl 1416.62314号
[32] 卡拉佐格鲁,A;迈耶,D;HORNIK,K,R中的支持向量机,统计软件杂志,15,1-28,(2006)
[33] 卡拉佐格鲁,A;斯莫拉,A;霍尼克,K;ZEILEIS,A,Kernlab—R中内核方法的S4包,统计软件杂志,11,1-20,(2004)
[34] 金,H;LOH,W,无偏多向分割的分类树,美国统计协会杂志,96589-604,(2001)
[35] KUHN,A.【J.Wing、S.Weston、A.Williams、C.Keefer、A.Engelhardt、T.Cooper、Z.Mayer和R核心团队的贡献](2014年),“caret:分类和回归培训。R包版本6.0-30”,http://CRAN.R-project.org/package=caret。
[36] KUHN,M.,WESTON,S.和COULTER,N.(2014年),“C50:C5.0决策树和基于规则的模型”,R程序包版本0.1.0-19,(R.Quinlan为C5.0编写的C代码),http://CRAN.R-project.org/package=C50。
[37] 兰德维尔,N;霍尔,M;FRANK,E,逻辑模型树,机器学习,59161-205,(2005)·Zbl 1101.68767
[38] LEISCH,F.和DIMITRIADU,E.(2010年),“mlbench:机器学习基准问题”,R程序包版本2.1-1,http://CRAN.R-project.org/package=mlbench。
[39] LIAW,A;《随机森林分类与回归》,R News,2,18-22,(2002)
[40] LOH,W-Y,提高分类树的精度,应用统计学年鉴,31710-1737,(2009)·Zbl 1184.62109
[41] 洛,W-Y;石英云,分类树的分割选择方法,统计,7815-840,(1997)·Zbl 1067.62545
[42] MCCULLAGH,P.和NELDER,J.A.(1989年),广义线性模型,伦敦:查普曼和霍尔·Zbl 0744.62098
[43] 《城市出行需求的计量》,公共经济学杂志,303-328,(1974)
[44] 梅纳德,S,多元logistic回归分析的决定系数,美国统计学家,54,17-24,(2000)
[45] 摩根,JN;SONQUIST,JA,《调查数据分析中的问题及建议》,美国统计协会期刊,58415-434,(1963)·京保0114.10103
[46] 斯考比特:logit和probit的另一种估计方法,美国政治科学杂志,38230-255,(1993)
[47] 内尔德,JA;韦德伯恩,RWM,广义线性模型,皇家统计学会杂志,A系列,135370-384,(1972)
[48] PETERS,A.和HOTHORN,T.(2013年),“ipred:改进的预测因子”,R软件包版本0.9-3,http://CRAN.R-project.org/package=ipred。 ·Zbl 1007.68152号
[49] 昆兰,J.R.(1993年),C4.5:机器学习程序,加州圣弗朗西索:摩根考夫曼出版公司。
[50] R核心团队(2016年),R: 统计计算语言和环境统计计算基金会,奥地利维也纳。
[51] RIPLEY,B.D.(1996年),模式识别与神经网络,纽约:剑桥大学出版社·Zbl 0853.62046
[52] RUSCH,T;李,我;霍尼克,K;张伟;ZEILEIS,A,《用统计影响选举:用逻辑回归树锁定选民》,《应用统计学年鉴》,71612-1639,(2013)·Zbl 1454.62505
[53] THERNEAU,T.,ATKINSON,B.和RIPLEY,B.D.(2014年)。rpart:递归分区和回归树. R程序包版本4.1-5,http://CRAN.R-project.org/package=rpart。
[54] VENABLES,W.N.和RIPLEY,B.D.(2002年)现代应用统计学,纽约:斯普林格·Zbl 1006.62003
[55] WITTEN,I.H.和FRANK,E.(2005年),数据挖掘:实用的机器学习工具和技术,加利福尼亚州旧金山:摩根考夫曼·Zbl 1076.68555
[56] 泽利斯,A;霍特霍恩,T;HORNIK,K,基于模型的递归划分,计算与图形统计杂志,17492-514,(2008)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。