×

正态分布斜标度背景下的均值漂移异常值模型。 (英语) Zbl 1510.62326号

摘要:近年来,在由于数据缺乏对称性而怀疑正态假设的情况下,非对称模型得到了广泛的讨论。评估拟合质量和诊断分析的技术对于模型验证很重要。本文研究了正态分布斜标度下回归模型中异常值检测的均值漂移方法。通过使用期望最大化算法,得到了参数估计量的解析解。对于每个分布,都会得到用于计算标准误差的观测信息矩阵。进行了仿真研究并将其应用于数据分析,表明了该方法在检测异常值方面的有效性。

理学硕士:

62J20型 诊断、线性推理和回归
62E10型 统计分布的特征和结构理论
10层62层 点估计
62J05型 线性回归;混合模型

软件:

R(右)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Azzalini A.包括正态分布的一类分布。Scand J统计。1985;12:171-178. [网络科学®],[谷歌学者]·Zbl 0581.62014号
[2] Gómez HW,Venegas O,Bolfarine H.正态分布函数生成的不对称分布。环境计量学。2007;18:395-407. doi:10.1002/env.817[Crossref],[Web of Science®],[Google学者]
[3] Ferreira CS,Bolfarine H,Lachos VH。正态分布的斜标度混合:性质和估计。统计方法。2011;8:154-171. doi:10.1016/j.stamet.2010.09.001[Crossref],[Web of Science®],[Google学者]·Zbl 1213.62023号
[4] Anscombe FJ,Guttman I.剔除异常值。技术指标。1960;2:123-147. doi:10.1080/00401706.1960.10489888[Taylor&Francis Online],[Google学者]·Zbl 0091.14806号
[5] Li W.使用Lasso同时进行变量选择和异常值检测,并将其应用于飞机着陆数据分析【博士论文】。新泽西州立大学;2012.[谷歌学者]
[6] Cook RD、Weisberg S.残差和回归影响。博卡拉顿(佛罗里达州):查普曼和霍尔/CRC出版社;1982.[谷歌学者]·Zbl 0564.62054号
[7] Peña D,Guttman I.比较线性模型中异常值检测的概率方法。生物特征。1993;80:603-610. doi:10.1093/biomet/80.3.603[Crossref],[Web of Science®],[Google学者]·Zbl 0800.62443号
[8] 潘J-X,方K-T。非结构化协方差矩阵增长曲线模型中的多个离群点检测。Ann Inst统计数学。1995;47:137-153. doi:10.1007/BF00773418[Crossref],[Web of Science®],[Google学者]·Zbl 0822.62045号
[9] 垫片KB。生长曲线模型中使用均值漂移模型的异常检测。《韩国数据信息科学与社会杂志》,1999年;10:369-385. [谷歌学者]
[10] Wei WH、Fung WK。一般加权回归中的均值漂移离群模型及其应用。计算机统计数据分析。1999;30:429-441. doi:10.1016/S0167-9473(98)00101-7[Crossref],[Web of Science®],[Google学者]·Zbl 1043.62523号
[11] Shi L,He L,Huang M.平衡单向分类随机效应模型中的多输出检测。数学科学学报。2007;27:476-487. doi:10.1016/S0252-9602(07)60017-4[Crosref],[Web of Science®],[谷歌学者]·Zbl 1174.62463号
[12] Zare K,Rasekh A.线性混合测量误差模型的诊断措施。SORT.2011;35:125-144. [网络科学®],[谷歌学者]·Zbl 1284.62472号
[13] Karasoy D,Daghan G.生物等效性研究中异常值的检验。公牛临床心理药理学。2012;22:307-312. [Taylor&Francis Online]、[Web of Science®]、[Google学者]
[14] Wei B-C,Shih J-Q.关于回归诊断的统计模型。Ann Inst统计数学。1994;46:267-278. doi:10.1007/BF01720584[Crossref],[Web of Science®],[Google学者]·Zbl 0803.62061号
[15] Fung W-K,Zhu Z-Y,Wei B-C,He X.半参数混合模型的影响诊断和异常值检验。J R Stat Soc Ser B.2002年;64:565-579. doi:10.1111/1467-9868.00351[交叉引用],[谷歌学者]·Zbl 1090.62039号
[16] She Y,Owen AB。使用非凸惩罚回归检测异常值。J Amer统计协会,2011年;106:626-639. doi:10.1198/jasa.2011.tm10390[Taylor&Francis Online],[Web of Science®],[Google学者]·Zbl 1232.62068号
[17] 郭J.案例删除和均值漂移异常值模型:等价性和超越性。地球物理学学报。2013;48:191-197. doi:10.1007/s40328-013-0017-5[Crossref],[Web of Science®],[Google学者]
[18] R核心团队。R: 用于统计计算的语言和环境。奥地利维也纳:R统计计算基金会;2013年。可从以下网址获得:网址:http://www.R-project.org/[谷歌学者]
[19] Ferreira CS,Lachos VH,Bolfarine H.正态回归模型的斜尺度混合中的推断和诊断。J统计计算模拟。2015;85(3):517-537. doi:10.1080/00949655.2013.828057[Taylor&Francis Online],[Web of Science®],[Google学者]·Zbl 1457.62209号
[20] Henze N.偏态正态分布的概率表示。Scand J统计。1986;13:271-275. [网络科学®],[谷歌学者]·Zbl 0648.62016号
[21] Andrews DF,Mallows CL.正态分布的比例混合。J R Stat Soc Ser B.1974年;36:99-102. [谷歌学者]·Zbl 0282.62017号
[22] Dempster A,Laird N,Rubin D.通过EM算法从不完整数据中获得最大似然。J R Stat Soc Ser B.1977年;39:1-38. [Crossref],[Google学者]·Zbl 0364.62022号
[23] 孟XL,鲁宾DB。通过ECM算法的最大似然估计:一般框架。生物特征。1993;81:633-648. [谷歌学者]·Zbl 0778.62022号
[24] Liu C,Rubin数据库。ECME算法:EM和ECM的简单扩展,具有更快的单调收敛性。生物特征。1994;80:267-278. [谷歌学者]·Zbl 0812.62028号
[25] Butler RJ、McDonald JB、Nelson RD、White SB。回归模型的稳健和部分自适应估计。Rev Econ统计。1990;72:321-327. doi:10.2307/2109722[Crossref],[Web of Science®],[Google学者]
[26] Azzalini A,Capitanio A.对称扰动产生的分布,重点是多元偏态t分布。J R Stat Soc Ser B.2003年;61:367-389. doi:10.1111/1467-9868.00391[交叉引用],[谷歌学者]·兹比尔1065.62094
[27] Philippe A.用混合物模拟左右截断伽马分布。统计计算。1997;7:173-181. doi:10.1023/A:1018534102043[Crossref],[Web of Science®],[Google学者]
[28] Lachos VH.Modelos lineares mistos assimétricos[博士论文]。圣保罗,IME-USP,Departamento de Estatística;2004年【谷歌学者】
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不声称其完整性或完全匹配。