×

序数回归模型的残差和诊断:替代方法。 (英语) Zbl 1398.62195号

摘要:顺序结果在科学研究和日常实践中很常见,我们经常依赖回归模型进行推断。这种回归分析的一个长期问题是缺乏有效的诊断工具来验证模型假设。困难来自这样一个事实,即序数变量具有离散值,这些离散值被标记为数值,而不是数值。这些值仅表示有序类别。在本文中,我们提出了一种替代方法来定义序数结果(Y)的残差。其思想是将连续变量(S)定义为(Y)的“代理变量”,然后基于(S)获得残差。对于一般的累积链接回归模型,我们研究了残差的理论和图形特性。我们表明,残差具有与连续结果的常见残差类似的空属性。我们的数值研究表明,残差有能力检测关于(1)平均值的错误指定结构;(2) 链接功能;(3) 异方差;(4) 比例性;(5)混合种群。提出的残差还使我们能够使用经典距离概念开发拟合优度的数值度量。我们的结果表明,与之前定义的残差相比,我们的残差可以揭示对模型诊断的更深入的见解。我们强调,这项工作侧重于残差分析,而不是假设检验。后者的效用有限,因为它只提供了一个单一的(p)值,而我们的残差可以揭示模型中哪些组件指定错误,并建议如何进行改进。

MSC公司:

62J12型 广义线性模型(逻辑模型)
62J20型 诊断、线性推理和回归
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Arbogast,P.G。;Lin,D.,分层病例对照研究的模型检验技术,医学统计学, 24, 229-247, (2005)
[2] 比鲁特,L.J。;阿格拉瓦尔。;Bucholz,K.K。;多尔尼,K.F。;劳里,C。;Pugh,E。;费希尔,S。;福克斯,L。;豪威尔斯,W。;Bertelsen,S.,《酒精依赖的全基因组关联研究》,美国国家科学院院刊, 107, 5082-5087, (2010)
[3] 邓恩,P.K。;Smyth,G.K.,随机分位数残差,计算与图形统计杂志, 5, 236-244, (1996)
[4] Hong,H.G。;He,X.,基于新序数回归模型的老年人功能状态预测,美国统计协会杂志, 105, 930-941, (2010) ·Zbl 1390.62264号
[5] Koenker,R。;Yoon,J.,《二元选择模型的参数链接:渔民-贝叶斯座谈会》,计量经济学杂志, 152, 120-130, (2009) ·Zbl 1431.62313号
[6] 李,C。;Shepherd,B.,调整协变量时两个序数变量之间的关联测试,美国统计协会杂志, 105, 612-620, (2010) ·Zbl 1392.62168号
[7] 有序结果的新残差,生物特征, 99, 473-480, (2012) ·Zbl 1239.62042号
[8] Little,R.J。;D.B.鲁宾。,缺失数据的统计分析,(2014),纽约威利
[9] 刘,D。;Liu,R.Y。;Xie,M.,仅使用汇总统计对异质性研究进行多元荟萃分析:效率和稳健性,美国统计协会杂志, 110, 326-340, (2015) ·Zbl 1373.62135号
[10] 刘,我。;穆克吉,B。;苏埃斯,T。;麻雀,D。;Park,S.K.,用于检查比例优势回归模型的模型错误的图形诊断,医学统计学,28412-429,(2009年)
[11] 马查多,J.A.F。;Silva,J.S.,计数分位数,美国统计协会杂志, 100, 1226-1237, (2005) ·Zbl 1117.62395号
[12] Nagler,J.,Scobit:logit和probit的替代估计器,美国政治科学杂志, 38, 230-255, (1994)
[13] Neuhaus,J.M.,二元回归中错误分类响应导致的偏差和效率损失,生物特征, 86, 843-855, (1999) ·Zbl 0942.62074号
[14] Stevens,W.,不连续分布参数的基准极限,生物特征, 37, 117-129, (1950) ·Zbl 0037.36701号
[15] Tanner,医学硕士。;Wong,W.H.,《从EM到数据增强:20世纪80年代MCMC贝叶斯计算的出现》,统计科学, 25, 506-516, (2010) ·Zbl 1329.65021号
[16] 张浩,精神疾病遗传学研究中的统计分析,统计科学, 26, 116-129, (2011) ·Zbl 1219.92050号
[17] 张,H。;王,X。;Ye,Y.,核心家族序数性状基因检测和关联研究的统一方法,遗传学, 172, 693-699, (2006)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。