×

正态回归模型的斜标度混合中的推断和诊断。 (英语) Zbl 1457.62209号

摘要:正态分布的斜标度混合通常用于涉及非对称数据和重尾数据的统计过程。这种分布族成员的主要优点是易于从中进行模拟,并且它们还提供了用于最大似然估计的真正期望最大化(EM)算法。在本文中,我们将EM算法扩展到线性回归模型,并遵循Zhu和Lee的方法,通过局部影响和广义杠杆来开发诊断分析。这是因为库克众所周知的方法不能用于衡量当地影响力。讨论了EM型算法,重点讨论了斜交Student正态分布、斜交斜杠分布、斜控正态分布和斜交幂指数分布。最后,报告了实际数据集的结果,说明了该方法的有效性。

MSC公司:

62J05型 线性回归;混合模型
10层62层 点估计
62J20型 诊断、线性推理和回归

软件:

R(右)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Andrews DF,Mallows CL.正态分布的比例混合。J Roy Statist Soc Ser B.1977年;36:99-102. [谷歌学者]·Zbl 0282.62017号
[2] Azzalini A、Dal Capello T、Kotz S.Log-skew-normal和Log-skew-T分布作为家庭收入数据的模型。2003年收入分配杂志;11:13-21。[谷歌学者]
[3] Galea-Rojas M,de Castillho M,Bolfarine H,de Castro M。分析偏差的检测。分析师。2003;128:1073-1081. (doi:10.1039/b212547a)[Crossref],[Web of Science®],[Google学者]·doi:10.1039/b212547a
[4] Lachos VH,Bolfarine H,Arellano-Valle RB,黑山LC。多元偏正态回归模型的基于似然的推断。通信统计理论方法。2007;36:1769-1786. (doi:10.1080/03610920601126241)[Taylor&Francis Online],[Web of Science®],[Google学者]·Zbl 1124.62037号 ·doi:10.1080/03610920601126241
[5] Ferreira CS,Bolfarine H,Lachos VH.正态分布的斜标度混合:性质和估计。统计方法。2011;8:2154-171. (doi:10.1016/j.stamet.2010.09.001)[交叉引用],[谷歌学者]·Zbl 1213.62023号 ·doi:10.1016/j.stamet.2010.09.001
[6] Azzalini A.包括正态分布的一类分布。Scand J统计。1985;12:171-178. [网络科学®],[谷歌学者]·兹伯利0581.62014
[7] Cook RD。线性回归中影响观察的检测。技术计量学。1977;19:5-18. [Web of Science®],[Google学者]·Zbl 0371.62096号
[8] Cook RD、Weisberg S.残差和回归影响。伦敦:查普曼和霍尔;1982.[谷歌学者]·Zbl 0564.62054号
[9] Cook RD。地方影响评估(讨论)。J Roy Statist Soc Ser B.1986年;48:133-169. [谷歌学者]·Zbl 0608.62041号
[10] Galea-Rojas M,Paula GA,Bolfarine H.椭圆线性回归模型中的局部影响。统计学家。1997;46:71-79. [谷歌学者]
[11] Lesaffre E,Verbeke G.线性混合模型中的局部影响。生物计量学。1998;54:570-582之间。(doi:10.2307/3109764)[Crossref],[PubMed],[Web of Science®],[Google学者]·Zbl 1058.62623号 ·doi:10.2307/3109764
[12] Osorio FS,Paula GA,Galea-Rojas M.具有纵向结构的椭圆线性模型的局部影响评估。计算统计数据分析。2007;51:4354-4368. (doi:10.1016/j.csda.2006.06.004)[Crossref],[Web of Science®],[Google学者]·Zbl 1162.62367号 ·doi:10.1016/j.csda.2006.06.004
[13] Zhu H,Lee S.不完全数据模型的局部影响。罗伊统计学会期刊,2001年B系列;63:111-126. (doi:10.1111/1467-9868.00279)[交叉引用],[谷歌学者]·Zbl 0976.62071号 ·doi:10.1111/1467-9868.00279
[14] Lee S,Xu L.非线性混合效应模型的影响分析。计算统计数据分析。2004;45:321-341. doi:10.1016/S0167-9473(02)00303-1[Crossref],[Web of Science®],[Google学者]·兹比尔1429.62280
[15] Lee SY,Tang NS。非线性结构方程模型的局部影响分析。Psycomerika(Psycomorika)。2004;69:573-592. (doi:10.1007/BF02289856)[Crossref],[Web of Science®],[Google学者]·Zbl 1306.62461号 ·doi:10.1007/BF02289856
[16] Monterogen LC,Lachos VH,Bolfarine H.偏正态线性混合模型的局部影响分析。公共统计理论方法。2009;38:4484-496. (doi:10.1080/03610920802238647)[Taylor&Francis Online],[Web of Science®],[Google学者]·Zbl 1159.62050号 ·网址:10.1080/03610920802238647
[17] Hoaglin DC,威尔士RE。回归和方差分析中的帽子矩阵。Amer统计公司。1978;32:17-22. [Taylor&Francis Online]、[Web of Science®]、[Google学者]·Zbl 0375.62070号
[18] 查特吉S,哈迪AS。线性回归中的敏感性分析。纽约:约翰·威利;1988.[交叉引用],[谷歌学者]·Zbl 0648.62066号
[19] 安德拉德足球俱乐部。阿拉万卡回归桥[硕士论文]。圣保罗大学;2004.[谷歌学者]
[20] St.Laurent RT,Cook RD。非线性回归中的杠杆和超杠杆。J Amer统计协会,1992年;87:985-990. [Taylor&Francis Online],[Google学者]
[21] Wei BC、Qu YQ、Fung WK。广义杠杆及其应用。Scand J统计。1998;25:25-37. (doi:10.1111/1467-9469.00086)[Crossref],[Web of Science®],[Google学者]·Zbl 0905.62070号 ·doi:10.1111/1467-9469.00086
[22] Lange K,Sinsheimer JS公司。正态/独立分布及其在稳健回归中的应用。计算图统计学杂志。1993;2:175-198. [Taylor&Francis Online],[Google学者]
[23] Dempster AP、Laird NM、Rubin DB。通过EM算法从不完整数据中获得最大似然。J Roy Statist Soc,Ser B.1977年;39:1-22. [谷歌学者]·Zbl 0364.62022号
[24] 孟XL,鲁宾DB。通过ECM算法的最大似然估计:一般框架。生物特征。1993;80:267-278. (doi:10.1093/biomet/80.2.267)[Crossref],[Web of Science®],[Google学者]·Zbl 0778.62022号 ·doi:10.1093/biomet/80.2.267
[25] Liu CH,Rubin数据库。ECME算法:EM和ECM的简单扩展,具有更快的单调收敛性。Biometrika公司。1994;81:633-648. (doi:10.1093/biomet/81.4.633)[Crossref],[Web of Science®],[Google学者]·兹伯利0812.62028 ·doi:10.1093/biomet/81.4.633
[26] R开发核心团队。R: 一种用于统计计算的语言和环境。奥地利维也纳R统计计算基金会;2012。软件可从以下网址获得:http://www.R-project.org。[谷歌学者]
[27] Lin TI,Lee JC,Yen SY.使用偏态正态分布的有限混合建模。中央统计局。2007;17:909-927. [Web of Science®],[Google学者]·兹比尔1133.62012
[28] Poon WY、Poon YS。共形法曲率和局部影响评估。J Roy Statist Soc,Ser B.1999;61:51-61. (doi:10.1111/1467-9868.00162)[Crosref],[谷歌学者]·Zbl 0913.62062号 ·doi:10.1111/1467-9868.00162
[29] 陆乙、宋晓阳。多元潜在变量模型的局部影响。多变量分析杂志。2006;97:1783-1798. (doi:10.1016/j.jmva.2005.10.004)[交叉引用],[科学网®],[谷歌学者]·Zbl 1099.62063号 ·doi:10.1016/j.jmva.2005.004
[30] Osorio FS公司。Diagnóstico de Influéncia em Modelos Elípticos com Efeitos Mistos[博士论文]。圣保罗USP;2006.[谷歌学者]
[31] Butler RL、McDonald JB、Nelson RD、White SB。回归模型的稳健和部分自适应估计。Rev Econ统计。1990年;72:321-327. (doi:10.2307/2109722)[Crossref],[Web of Science®],[Google学者]·doi:10.2307/2109722
[32] Azzalini A,Capitanio A.对称扰动产生的分布,强调多元偏态t分布。J Roy Statist Soc,Ser B.2003;65:367-389. (doi:10.1111/1467-9868.00391)[交叉引用],[谷歌学者]·Zbl 1065.62094号 ·数字对象标识代码:10.1111/1467-9868.00391
[33] Philippe A.用混合物模拟左右截断伽马分布。统计计算。1997;7点173-181分。(doi:10.1023/A:1018534102043)[Crossref],[Web of Science®],[Google学者]·doi:10.1023/A:1018534102043
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。