×

缺失数据的高斯copula中的EM算法。 (英语) Zbl 1466.62056号

摘要:基于秩的相关性被广泛用于测量变量之间的相关性,当它们的边际分布发生偏差时。这种相关性的估计受到缺失数据的存在和调整混杂因素的需要的挑战。在本文中,我们考虑了高斯copula回归的统一框架,该框架使我们能够根据边际分布的类型估计皮尔逊相关性或基于等级的相关性(例如Kendall’s tau或Spearman’s rho)。为了调整混杂协变量,我们使用了具有单变量位置尺度家族分布的边际回归模型。我们建立了EM算法来估计具有缺失值的相关和回归参数。为了实现,我们提出了一个有效的剥离过程来执行EM算法所需的迭代。通过仿真研究,我们比较了EM算法与传统多重插补方法的性能。对于结构化类型的相关性,例如可交换或一阶自回归(AR-1)相关性,EM算法在估计偏差和效率方面都优于多重插补方法。

MSC公司:

62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿布拉莫维茨,M。;Stegun,I.A.,《数学函数手册:公式、图形和数学表》,第55卷,(1972年),Courier Dover出版社·Zbl 0543.33001号
[2] Acar,E.F。;Genest,C。;NešLehová,J.,《超越简化的对copula构造》,J.多元分析。,110, 74-90, (2012) ·Zbl 1243.62067号
[3] 安德里奇,R.R。;Little,R.J.,《调查无应答的热卡插补综述》,国际。统计师。修订版,78,1,40-64,(2010)
[4] Ané,T。;Kharoubi,C.,依赖结构和风险度量*,J.Bus。,76, 3, 411-438, (2003)
[5] Czado,C.,多元copula的对copula构造,(copula理论及其应用,(2010),Springer),93-109
[6] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中获得最大似然》,J.R.Stat.Soc.Ser。B统计方法。,1-38, (1977) ·Zbl 0364.62022号
[7] Fan,Y.,Zhu,D.,2009年。潜在结果联合分布函数的部分识别和置信集。技术代表,工作文件。
[8] 弗里斯,J。;布鲁斯,B。;Cella,D.,《承诺的承诺:使用项目反应理论改进患者报告结果的评估》,临床。实验风湿病。,23、5、S53(2005)
[9] Genest,C。;Nešlehová,J。;Ben Ghorbal,N.,《基于多元copula模型中kendallτ的估计量》,澳大利亚。N.Z.J.Stat.,53,2,157-177,(2011年)·Zbl 1274.62367号
[10] Genest,C。;Quesada Molina,J。;罗德里格斯·拉列纳(Rodríguez Lallena),J.,《多维市场建设的权力》,C.R.Acad。科学。,巴黎一世,320,6723-726,(1995年)·Zbl 0832.60020号
[11] Gipson,D.S。;Selewski,D.T。;马森吉尔,S.F。;威克曼。;Messer,K.L。;Herreshoff,E。;鲍尔斯,C。;费里斯,M.E。;马汉,J.D。;Greenbaum,L.A.,《从肾病综合征儿童获得前景展望:中西部儿童肾病联合研究》,健康质量。生活成果,11,3,(2013)
[12] 格雷厄姆,J.W。;奥尔乔夫斯基,A.E。;Gilreath,T.D.,实际需要多少插补?多重插补理论的一些实际澄清,Prev。科学。,8, 3, 206-213, (2007)
[13] 黄,W。;Prokhorov,A.,《连接线的良好性检验》,《计量经济学评论》,第33期,第751-771页,(2014年)
[14] Joe,H.,《多元模型和多元相关性概念》,第73卷,(1997),CRC出版社
[15] Joe,H.,基于copula模型的两阶段估计方法的渐近效率,J.多元分析。,94, 401-409, (2005) ·Zbl 1066.62061号
[16] Joe,H。;李,H。;Nikoloulopoulos,A.K.,尾依赖函数和藤蔓连接,J.多元分析。,101, 1, 252-270, (2010) ·Zbl 1177.62072号
[17] 梁国勇。;Zeger,S.L.,使用广义线性模型进行纵向数据分析,Biometrika,73,1,13-22,(1986)·Zbl 0595.62110号
[18] Little,R.J。;鲁宾,D.B.,(Little,R.J.A.;鲁宾,D.B.,《缺失数据的统计分析》,《概率统计中的威利级数》(2002),威利,纽约州纽约市),1,缺失数据的统计学分析,2002
[19] Louis,T.A.,《使用EM算法时发现观测信息矩阵》,J.R.Stat.Soc.Ser。B统计方法。,226-233, (1982) ·兹比尔0488.62018
[20] Manski,C.F.,概率分布的部分识别,(2003),施普林格·Zbl 1047.62001
[21] Masarotto,G。;Varin,C.,高斯copula边缘回归,电子。《J Stat.》,第6卷,第1517-1549页,(2012年)·Zbl 1336.62152号
[22] 麦克尼尔,A.J。;弗雷,R。;Embrachts,P.,《定量风险管理:概念、技术和工具》,(2010年),普林斯顿大学出版社·兹比尔1089.91037
[23] 孟,X.-L。;Rubin,D.B.,《通过ECM算法的最大似然估计:一般框架》,《生物特征识别》,80,2,267-278,(1993)·Zbl 0778.62022号
[24] Nelder,J.A。;Baker,R.,广义线性模型,百科全书统计科学。,(1972)
[25] 曲,A。;林赛,B.G。;Li,B.,使用二次推理函数改进广义估计方程,Biometrika,87,4,823-836,(2000)·Zbl 1028.62045号
[26] Rubin,D.B.,《调查中无应答的多重插补》,第81卷,(2004),John Wiley&Sons·兹比尔1070.62007
[27] Scaillet,O.,《具有固定平滑参数的连接函数的基于核的优良性检验》,《多元分析杂志》。,98, 533-543, (2007) ·Zbl 1107.62037号
[28] Segers,J。;van den Akker,R。;Werker,B.J.,《半参数高斯copula模型:几何和有效的基于秩的估计》,Ann.Statist。,1911-1940年第42期(2014年)·Zbl 1305.62115号
[29] Sklar,M.,《尺寸和边缘的Répartitionàn dimensions and leurs marges基金会》,第8期,(1959年),巴黎大学
[30] Song,P.X.-K.,由高斯copula生成的多元离散模型,Scand。J.统计。,27, 2, 305-320, (2000) ·Zbl 0955.62054号
[31] Song,P.X.-K.,相关数据分析:建模、分析和应用,(2007),Springer·Zbl 1132.62002号
[32] 宋,P.X.-K。;江,Z。;帕克,E。;Qu,A.,纵向数据边际模型中的二次推理函数,《统计医学》,28,29,3683-3696,(2009)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。