×

线性多级模型的基于回归树的诊断。 (英语) Zbl 07257468号

摘要:纵向和集群数据需要特殊的模型来反映其层次结构,在这些数据中可以观察到个体的多个观察结果。最常用的这种模型是线性多级模型,它结合了人口水平固定效应的线性模型、正态分布个体水平随机效应的线性模式和常方差正态分布观测水平误差。它具有解释简单的优点,但如果模型的假设不成立,得出的推论可能会产生误导。在本文中,我们讨论了使用为多层次数据设计的回归树来构建此模型的良好性测试,该测试可用于测试固定效应的非线性或误差的异方差。模拟结果表明,与0.05级测试相比,所得测试略显保守,并且有很好的能力识别可解释的模型违规(即与数据中可用协变量信息相关的违规)。在两个实际数据集上说明了测试的应用。

理学硕士:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Breiman,L,Friedman,JH,Olshen,RA,Stone,CJ(1984)分类和回归树。加利福尼亚州蒙特利:华兹华斯·Zbl 0541.62042号
[2] Calvin,JA,Sedransk,J(1991)护理研究模式的贝叶斯和频率学家预测推断。美国统计协会杂志,86,36−48·doi:10.1080/01621459.1991.1047502
[3] Davidian,M,Giltinan,DM(1995),重复测量数据的非线性模型。伦敦:查普曼和霍尔。
[4] De’Ath,G(2002)《多元回归树:物种与环境关系建模的新技术》。生态学,83,1105−17·doi:10.1890/0012-9658(2002)083[1105:MRTANT]2.0.CO;2
[5] Diggle,P,Liang,K-Y,Zeger,SL(1994)纵向数据分析。牛津:克拉伦登出版社。
[6] Galinberti,G,Montanari,A(2002)具有时间相关协变量的纵向数据回归树。在Jajuga,K,Sokolowski,A,Bock,H-H(eds)Classification,clustering and data analysis中,第391-98页。纽约:斯普林格。 ·doi:10.1007/978-3-642-56181-843
[7] Ghose,A,Ipeirotis,P,Sundararajan,A(2005)《电子市场声誉的维度》。技术报告06-02,纽约大学CeDER工作文件。
[8] Goldstein,H(2011)多层统计模型,第4版。奇切斯特:威利·Zbl 1274.62006年
[9] Hajjem,A,Bellavance,F,Larocque,D(2011),聚类数据的混合效应回归树。《统计与概率快报》,81,451−59·Zbl 1207.62136号 ·doi:10.1016/j.spl.2010.12.003
[10] Hothorn,T,Hornik,K,Zeileis,A(2006)《无偏递归划分:条件推理框架》,《计算与图形统计杂志》,第15期,第651−74页·doi:10.1198/106186006X133933
[11] Laird,NM,Ware,JH(1982)纵向数据的随机效应模型。生物计量学,38,963−74·Zbl 0512.62107号 ·doi:10.2307/2529876
[12] Lee,SK(2005)利用GEE研究广义多元决策树。计算统计与数据分析,49,1105−19·兹比尔1429.62565 ·doi:10.1016/j.csda.2004.07.003
[13] Lee,SK(2006)关于多重响应的分类和回归树及其应用。分类杂志,23,123−41·doi:10.1007/s00357-006-0007-1
[14] Loh,W-Y(2002)无偏变量选择和交互检测回归树。中国统计局,12,361−86·Zbl 0998.62042号
[15] Milborrow,S(2011)rpart.plot:绘制rpart模型。R包版本1.2-2。
[16] Miller,TW(1996)《将CART置于马之后:树结构回归诊断》。美国统计协会统计计算科会议记录,150−55。
[17] Molenberghs,G,Verbeke,G(2011)关于负方差分量层次解释的注释。统计建模,11389−408·Zbl 1420.62012年
[18] Morgan,JN,Sonquist,JA(1963)调查数据分析中的问题和建议。《美国统计协会杂志》,58,415−34·Zbl 0114.10103中 ·网址:10.1080/01621459.1963.10500855
[19] Nobre,JS,Singer,JM(2007)线性混合模型的残差分析。《生物医学杂志》,49,863−75·Zbl 1442.62606号 ·doi:10.1002/bimj.200610341
[20] Pinheiro,JC,Bates,DM(2000)《S和S-PLUS中的混合效应模型》。纽约:斯普林格·Zbl 0953.62065号 ·doi:10.1007/978-1-4419-0318-1
[21] R开发核心团队(2011)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。ISBN 3-900051-07-0,http://www.R-project.org。
[22] Segal,MR(1992),纵向数据的树结构模型。美国统计协会杂志,87,407−18·doi:10.1080/01621459.1992.10475220
[23] Sela,RJ,Simonoff,JS(2012a)RE-EM树:用于纵向和聚类数据的数据挖掘方法。机器学习,86,169−207·Zbl 1238.68131号 ·doi:10.1007/s10994-011-5258-3
[24] Sela,RJ,Simonoff,JS(2012b)REEMtree:纵向(面板)数据的随机效应回归树。R包版本0.90.3。
[25] Su,X,Tsai,C-L,Wang,MC(2009),线性回归的树结构模型诊断。机器学习,74,111−31·Zbl 1200.68083号 ·doi:10.1007/s10994-008-5080-8
[26] Therneau,TM,Atkinson,B(2010)rpart:递归分区。Brian Ripley的R端口。R软件包版本3.1−46。
[27] Verbeke,G,Molenberghs,G(2000)纵向数据的线性混合模型。纽约:斯普林格·Zbl 0956.62055号
[28] Zhang,F,Weiss,RE(2000)随机效应模型中方差的可解释异质性诊断。加拿大统计杂志,28,3−18·Zbl 0961.62064号 ·doi:10.2307/3315878
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。