×

健康科学中倾斜数据的稳健推断。 (英语) Zbl 07540776号

总结:健康数据通常不对称,无法通过通常的正态分布进行充分建模;它们中的大多数表现出偏斜的模式。通过涵盖倾斜和对称情况的更大的偏正态分布族,确实可以更好地对它们进行建模。由于离群值在复杂的实际实验数据集中并不罕见,因此,一种自动处理数据中噪声的稳健方法对于产生稳定和更精确的研究见解,从而更好地制定政策,将具有巨大的实用价值。在本文中,我们使用最小密度幂散度方法为偏态分布族开发了一类稳健估计和测试程序,并将其应用于健康数据。特别地,讨论了存在离群值时对称性测试的稳健程序。讨论了两种有效的计算算法。除了推导出所提方法的渐近性和稳健性理论外,还通过对澳大利亚体育与艾滋病研究所(Australian Institute of Sports and AIDS)运动员健康数据的模拟和两个实际应用,说明了它们的优势和实用性。

MSC公司:

62至XX 统计

软件:

PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Azzalini,A.,包含正态分布的一类分布,Scand。J.Stat.,12171-178(1985)·Zbl 0581.62014号
[2] Azzalini,A.,关于一类分布的进一步结果,包括正态分布,Statistica,46199-208(1986)·Zbl 2013年6月6日
[3] Azzalini,A.,《偏态正态分布和相关多变量家族》,Scand。《美国统计杂志》,32,159-188(2005)·Zbl 1091.62046号
[4] Azzalini,A.,《不对称分布族》,载于《国际百科全书统计科学》,M.Lovric,ed.,Springer,Berlin Heidelberg,2011年,第1344-1346页。
[5] 阿扎里尼,A。;Regoli,G.,Fernando de Helguero关于选择引起的非正常现象的工作,《智利统计》,3(2012)·Zbl 1449.62001号
[6] Bandyopadhyay,D。;拉科斯,V.H。;阿班托瓦莱,加利福尼亚州。;Ghosh,P.,偏正态/独立双变量反应的线性混合模型及其在牙周病中的应用,《统计医学》,29,2643-2655(2010)
[7] Barzilai,J。;Borwein,J.M.,两点步长梯度法,IMA J.Numer。分析。,8, 141-148 (1988) ·Zbl 0638.65055号
[8] 巴索·R·M。;拉科斯,V.H。;卡布拉尔,C.R.B。;Ghosh,P.,基于偏态正态分布比例混合的稳健混合建模,计算。统计数据分析。,54, 2926-2941 (2010) ·Zbl 1284.62193号
[9] 巴苏,A。;哈里斯,I.R。;Hjort,N.L。;Jones,M.C.,通过最小化密度功率发散进行稳健有效的估计,Biometrika,85,549-559(1998)·Zbl 0926.62021号
[10] 巴苏,A。;曼达尔,A。;N.马丁。;Pardo,L.,基于最小密度幂散度估计的广义Wald型检验,统计学。,50, 1-26 (2016) ·兹比尔1342.62042
[11] 巴苏,A。;Shioya,H。;Park,C.,《统计推断:最小距离法》(2011),Chapman和Hall/CRC:Chapman和Hall/CRC,佛罗里达州博卡拉顿·Zbl 1281.62016年
[12] 布莱斯,G。;休伯特,M。;Struyf,A.,《偏度的稳健度量》,J.Compute。图表统计,13996-2017(2004)
[13] Brys,G.,Hubert,M.和Struyf,A.,《一些新的偏度度量方法的比较》,摘自《稳健统计学的发展》,R.Dutter,P.Filzmoser,U.Gather和P.J.Rousseeuw,eds.,Physica,Heidelberg,2003年,第98-113页·Zbl 1135.62311号
[14] 卡斯特罗,L.M。;Wang,W.L。;拉科斯,V.H。;伊纳西奥·德·卡瓦略,V。;Bayes,C.L.,具有截尾和偏倚的HIV纵向数据的贝叶斯半参数建模,Statist Methods Med Res,281457-1476(2019)
[15] Chudasama,C.,Shah,S.M.和Panchal,M.,TSP遗传算法的父母选择方法比较,计算机通信与网络国际会议,CSI-COMNET-2011,2011年会议记录,第85-87页。
[16] 克罗塞塔,C。;Loperfido,N.,慢性心力衰竭患者最大耗氧量与6分钟步行试验相关性的最大似然估计,J.Appl。统计,36,1101-1108(2009)·兹比尔1511.62326
[17] 达席尔瓦·费雷拉,C。;维尔卡,F。;Bolfarine,H.,《偏正态线性回归模型的诊断分析:生活质量数据集的应用》,Braz。J.探针。统计,32,525-544(2018)·Zbl 1398.62203号
[18] Daly,C.H。;希金斯,V。;阿德利,K。;灰色,V.L。;Hamid,J.S.,《参考区间估计:使用广泛模拟和经验数据的方法比较》,临床。生物化学。,50, 1145-1158 (2017)
[19] Ghalani,M.R。;Zadkarami,M.R.,用斜正态随机效应模拟纵向有序响应时协方差结构的研究,Communic。统计模拟。计算。,50, 1-16 (2019)
[20] Ghosh,A.,贝塔回归模型下的稳健推断及其在医疗研究中的应用,统计学。方法。医学研究,28871-888(2019)
[21] Ghosh,A。;Basu,A.,《使用密度幂散度进行独立非均匀观测的稳健估计及其在线性回归中的应用》,电子。J.Stat.,7,2420-2456(2013)·Zbl 1349.62087号
[22] Ghosh,A。;Basu,A.,非齐次数据的稳健估计和最佳调整参数的选择:DPD方法,J.Appl。统计,42,2056-2072(2015)·Zbl 1514.62584号
[23] Ghosh,A。;Basu,A.,基于随机协变量截尾数据的稳健有效参数估计,统计学。,51, 801-823 (2017) ·兹比尔1440.62358
[24] Ghosh,A.、Basu,A.和Pardo,L.,随机审查下的稳健Wald-Type测试及其在临床试验分析中的应用,Preprint(2019),arXiv:1708.09695v2[stat.ME]
[25] Ghosh,A。;曼达尔,A。;N.马丁。;Pardo,L.,鲁棒Wald型检验的影响分析,J.Mult。分析。,147, 102-126 (2016) ·Zbl 1336.62110号
[26] 为什么移民的健康状况会恶化?出生记录证据,J.Health Econ。,54, 1-16 (2017)
[27] Goldberg,D.E.,《搜索、优化和机器学习中的遗传算法》(1989),Addison-Wesley Longman Publishing Company Inc.:Addison-Whesley Longman出版社,波士顿·Zbl 0721.68056号
[28] 古特曼,R。;Rubin,D.B.,用一个连续的协变量评估未经证实的研究中二元处理的因果效应,统计学。方法。医学研究,2611199-1215(2017)
[29] 汉佩尔,F.R。;Ronchetti,E。;Rousseeuw,P.J。;Stahe,l.W.A.,《稳健统计:基于影响函数的方法》(1986),John Wiley&Sons:John Willey&Sons,美国纽约·Zbl 0593.62027号
[30] Hashimoto,S.,通过对数变化函数对位置和尺度参数的偏态正态分布进行稳健估计,国际统计系统杂志。,12, 813-822 (2017)
[31] Hinkley,D.V.,《论对称的幂变换》,《生物统计学》,第62卷,第101-111页(1975年)·Zbl 0308.62007号
[32] Hoseinzadeh,A。;Maleki,M。;Khodadadi,Z。;Contreras-Reyes,J.E.,用于分析对称和非对称数据的Skew-Reflected-Gompertz分布,J.Compute。申请。数学,349132-141(2019)·Zbl 1409.62045号
[33] 侯赛因,A。;Beyene,J.,《偏正态分布在检测微RNA数据差异表达中的应用》,J.Appl。Stat.,42,477-491(2015)·Zbl 1514.62628号
[34] Huang,C.Y。;Ku,M.S.,粒径分布对低剂量固体药物含量均匀性和过效力风险的不对称影响,《药物科学杂志》。,99, 4351-4362 (2010)
[35] Hubert,M.,《倾斜分布的调整箱线图》,计算。统计数据分析。,52, 5186-5201 (2008) ·Zbl 1452.62074号
[36] 休伯特,M。;Van der Veeken,S.,偏斜数据的离群检测,J.Chemom。,22, 235-246 (2008)
[37] 嗯,M-H。;Lee,Y.,Skew normal箱线图和异常值,Commun。统计应用程序。方法。,19591-595(2012年)
[38] Kim,D。;Fessler,J.A.,光滑凸最小化的优化一阶方法,数学。程序。,159, 81-107 (2016) ·Zbl 1345.90113号
[39] 拉科斯,V.H。;卡斯特罗,L.M。;Dey,D.K.,使用正态独立分布的非线性混合效应模型中的贝叶斯推断,计算。统计数据分析。,64, 237-252 (2013) ·Zbl 1468.62109号
[40] 刘,L。;斯特劳德曼,R.L。;约翰逊,B.A。;O'Quigley,J.M.,《分析重复测量半连续数据,并应用于酒精依赖性研究》,Statist。方法。《医学研究》,25,133-152(2016)
[41] Maleki,M。;孔特拉斯·雷伊斯,J.E。;Mahmoudi,M.R.,基于正态族两段尺度混合的稳健混合建模,《公理》,8,38(2019)·Zbl 1432.62029
[42] 梅洛皮,P。;比科斯,C。;George,Z.,《倾斜数据中的离群点检测》,模拟。示范实践理论。,87, 191-209 (2018)
[43] Ngunkeng,G.,《斜态正态分布的统计分析及其应用》,博林格林州立大学博士论文,2013年
[44] Nurminen,H。;Ardeshiri,T。;Piche,R。;Gustafsson,F.,《带有倾斜测量噪声的状态空间模型的稳健推断》,IEEE信号处理。莱特。,22, 1898-1902 (2015)
[45] Partlett,C.,医学研究数据中的不对称和其他分布特性。伯明翰大学博士论文;2015
[46] 罗宾斯,H。;Monro,S.,《随机近似方法》,《数学年鉴》。《统计》,22,400-407(1951)·Zbl 0054.05901号
[47] Sengupta,D.,Choudhary,P.K.和Cassey,P.,《偏斜和重尾方法比较数据的建模与分析》,有序数据分析,建模与健康研究方法,Springer,Cham,2015年,第169-187页·Zbl 1341.62131号
[48] Sivananadam,S.N。;Deepa,S.N.,《遗传算法导论》(2008),斯普林格·弗拉格:斯普林格尔·弗拉格,柏林-海德堡·Zbl 1129.90001号
[49] Smirnova,E。;Huzurbazar,S。;Jafari,F.,PERFect:微生物数据的PER突变过滤测试,生物统计学,20615-631(201818)
[50] Smith,V.A.公司。;Neelon,B。;Preisser,J.S。;Maciejewski,M.L.,纵向半连续数据的边缘化两部分模型,统计。方法。医学研究,1949-1968年第26期(2017年)
[51] 斯尼曼,J.A。;Wilke,D.N.,《实用数学优化——基本优化理论和基于梯度的算法》,133(2018),Springer·Zbl 1401.90007号
[52] 孙,Y。;Hering,A.S。;Browning,J.M.,《倾斜数据中稳健的双变量误差检测及其在历史无线电探空风中的应用》,环境计量学,28,e2431(2017)
[53] 特尔福德,R.D。;坎宁安,R.B.,《训练有素运动员血液学对性别、运动和体型的依赖性》,医学科学。体育锻炼。,23788-794(1991年)
[54] van den Hout,A。;Matthews,F.E.,《分段恒定马尔可夫模型和研究设计对健康和疾病患者预期寿命估计的影响》,统计学。方法。医学研究,18,145-162(2009)
[55] Vandenberghe,L.,《快速梯度法》,2019年加州大学洛杉矶分校EE236C课堂讲稿
[56] 沃里克,J。;Jones,M.C.,《选择鲁棒性调整参数》,J.Stat.Compute。模拟。,75, 581-588 (2005) ·Zbl 1115.62317号
[57] Wason,J.M。;Mander,A.P.,《在第二阶段癌症试验中,当预期有完全反应时,评估肿瘤持续收缩的试验选择》,Statist。方法。《医学研究》,24,909-919(2015)
[58] Wu,L.,具有删失和误差测量协变量的非线性混合效应模型的联合模型,及其在艾滋病研究中的应用,J.Amer。统计师。协会,97,955-964(2002)·Zbl 1048.62111号
[59] Wu,H。;Ding,A.A.,《体内HIV-1人群动态:艾滋病临床试验病毒学数据的适用模型和推断工具》,生物统计学,55,410-418(1999)·Zbl 1059.62735号
[60] Xing,D。;黄,Y。;陈,H。;Zhu,Y。;达恩,G.A。;Baldwin,J.,使用倾斜分布对两部分混合效应模型进行贝叶斯推断,并应用于纵向半连续酒精数据,Statist。方法。医学研究,261838-1853(2017)
[61] Yalçinkaya,A。;Enoglu,B。;Yolcu,U.,使用遗传算法对斜态正态分布参数进行最大似然估计,Swarm Evolut。计算。,38, 127-138 (2018)
[62] Yiu,S。;Tom,B.D.,《纵向半连续数据建模的随机过程两部分模型:计算效率推断和整体边际平均值建模》,统计。方法。医学研究,27,3679-3695(2018)
[63] Yuan,Y.,梯度法的步长,AMS/IP Stud.Adv.Math。,42785-805(1999年)
[64] Zeller,C.B。;卡布拉尔,C.R。;Lachos,V.H.,基于偏态正态分布比例混合的稳健混合回归建模,TEST,25,375-396(2016)·Zbl 1342.62113号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。