×

对不可忽略的缺失数据进行基于全最小参数的类比推理。 (英语) Zbl 1524.62058号

摘要:现有的大多数关于缺失数据问题的研究都集中在可忽略的缺失情况,在这种情况下,缺失概率仅取决于可观测量。相比之下,对不可忽视的缺失数据问题的研究相当有限。解决此类问题的主要困难在于,丢失概率和回归似然函数在似然表示中纠缠在一起。此外,即使在强参数模型假设下,模型参数也可能无法识别。本文讨论了具有不可忽略缺失响应数据的半参数模型,并提出了一种最大全半参数似然估计方法。该方法是参数条件似然和边缘非参数有偏采样似然的有效结合。我们进一步证明了所提出的基本参数和响应平均值的估计是半参数有效的。大量仿真和实际数据分析证明了该方法相对于竞争方法的优势。

MSC公司:

62D10号 缺少数据
62G05型 非参数估计
2012年12月62日 参数估计量的渐近性质
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Ai,C.、Linton,O.和Zhang,Z.(2018年)。一种简单有效的具有不可忽略缺失数据模型的估计方法。中国统计局。新闻界。DOI:10.5705/ss.202018.0107·Zbl 1464.62256号 ·doi:10.5705/ss.202018.0107
[2] Anderson,J.A.(1979)。多元逻辑复合。生物特征66,17-26·兹伯利0309.62029
[3] Baker,S.G.和Laird,N.M.(1988年)。分类变量的回归分析,结果受不可忽视的无反应影响。美国统计协会杂志83,62-69。
[4] Bondell,H.D.(2007年)。在逻辑病例对照研究中测试药片的质量。生物特征94487-495·Zbl 1132.62020年
[5] Cai,S.、Chen,J.和Zidek,J.V.(2017)。密度比模型下存在多个样本的假设检验。中国统计27,761-783·Zbl 1368.62111号
[6] Chang,T.和Kott,P.S.(2008)。在合理的模型下,使用校准权重调整无响应。生物特征95557-571·Zbl 1437.62411号
[7] Chen,J.和Liu,Y.(2013)。密度比模型下的分位数和分位数函数估计。统计年鉴411669-1692·Zbl 1292.62072号
[8] Cheng,K.F.和Chu,C.K.(2004)。两样本密度比模型下的半参数密度估计。伯努利10,583-604·Zbl 1055.62032号
[9] Cox,D.R.和Snell,E.J.(1968年)。残差的一般定义。英国皇家统计学家学会期刊,B辑(方法论)30248-275·Zbl 0164.48903号
[10] Greenlees,J.S.、Reece,W.S.和Zieschang,K.D.(1982)。当响应概率取决于被插补变量时,缺失值的插补。美国统计协会杂志77,251-261。
[11] Groves,R.M.、Presser,S.和Dipko,S.(2004)。主题兴趣在调查参与决策中的作用。《民意季刊》68,2-31。
[12] Hammer,S.M.、Katzenstein,D.A.、Hughes,M.D.、Gundaker,H.、Schooley,R.T.、Haubrich,R.H.等人(1996年)。一项对CD4细胞计数为每立方毫米200到500个艾滋病毒感染成人进行核苷单药治疗和联合治疗的对比试验。《新英格兰医学杂志》335,1081-1090。
[13] Kenward,M.G.和Molenberghs,G.(1988年)。当数据随机丢失时,基于可能性的频繁度推断。中国统计局13,236-247·Zbl 1099.62503号
[14] Kim,J.K.和Yu,C.L.(2011年)。具有非ig-norable缺失数据的平均泛函的半参数估计。美国统计协会杂志106,157-165·Zbl 1396.62032号
[15] Kott,P.S.和Chang,T.(2010年)。使用校准权重调整不可忽视的装置无响应。《美国统计协会杂志》105,1265-1275·Zbl 1390.62011年
[16] Lee,B.和Marsh,L.C.(2000年)。缺失响应观测的样本选择偏差校正。牛津经济与统计公报62,305-322。
[17] Little,R.J.A.(1985年)。关于选择性偏差模型的注释。《计量经济学》53,1469-1474·Zbl 0582.62099号
[18] Little,R.J.A.和Rubin,D.B.(2002年)。缺失数据的统计推断。第二版。新泽西州霍博肯威利·Zbl 1011.62004号
[19] Liu,D.和Zhou,X.(2010)。基于似然方法的ROC曲线及其面积估计中不可忽视验证偏差调整模型。生物统计学66,1119-1128·Zbl 1233.62183号
[20] Louis,T.A.(1982年)。当使用EM算法时,找到观察到的信息矩阵。英国皇家统计学会杂志,B辑(统计方法)44,226-233·Zbl 0488.62018号
[21] Miao,W.,Ding,P.和Geng,Z.(2016)。具有不可忽略缺失数据的正态和正态混合模型的可识别性。美国统计协会杂志1111673-1683。
[22] Morikawa,K.和Kim,J.K.(2016)。不可忽略无响应数据的半参数自适应估计。arXiv预打印arXiv:1612.09207。
[23] Morikawa,K.、Kim,J.K.和Kano,Y.(2017年)。数据缺失非随机的半参数极大似然估计。《加拿大统计杂志》45,393-409·兹比尔1474.62071
[24] Owen,A.B.(1988年)。单个函数的经验似然比置信区间。生物特征75,237-249·Zbl 0641.62032号
[25] Owen,A.B.(1990年)。经验似然比置信区。《统计年鉴》18,90-120·Zbl 0712.62040号
[26] Owen,A.B.(2001年)。经验可能性。查普曼和霍尔/CRC,纽约·Zbl 0989.62019
[27] Qin,J.、Leung,D.和Shao,J.(2002)。在不可忽视的无应答或信息抽样下使用调查数据进行估计。《美国统计协会杂志》97,193-200·Zbl 1073.62513号
[28] Qin,J.和Zhang,B.(1997)。基于病例对照数据的logistic回归模型的有效性检验。生物特征84,609-618·Zbl 0888.62045号
[29] Riddles,M.K.、Kim,J.K.和Im,J.(2016)。一种不可忽视的无响应的倾向核调整方法。《调查统计与方法杂志》4,215-245。
[30] Robins,J.M.和Ritov,Y.(1997年)。针对半参数模型的维数灾难适当(CODA)渐近理论。医学统计16,285-319。
[31] Rubin,D.B.(1987)。调查中无应答的多重插补。纽约威利·兹比尔1070.62007
[32] Shao,J.(2018)。不可忽略非响应的半参数倾向加权:讨论唐念生和朱元元的“不可忽略缺失数据问题的统计推断:选择性综述”。统计理论及相关领域2141-142·Zbl 07660169号
[33] Shao,J.和Wang,L.(2016)。不可忽略缺失数据的半参数逆倾向加权。生物特征103,175-187·Zbl 1452.62294号
[34] Tang,G.、Little,R.J.A.和Raghunathan,T.E.(2003)。不可忽视无反应的多元缺失数据分析。生物特征90,747-764·Zbl 1436.62206号
[35] Tang,N.和Ju,Y.(2018)。不可忽视的缺失数据问题的统计推断:选择性综述。统计理论及相关领域2,105-133·Zbl 07660165号
[36] Tang,N.、Zhao,P.和Zhu,H.(2014)。估计具有不可忽视的缺失数据的方程的经验似然。中国统计局24,723-747·Zbl 1285.62035号
[37] Tsiatis,A.A.(2006年)。半参数理论和缺失数据。纽约州施普林格·Zbl 1105.6202号
[38] Wang,S.、Shao,J.和Kim,J.K.(2014)。选择偏差模型中的经验分布。统计Sinica 24,1097-116·Zbl 1534.62039号
[39] Yang,L.(2019)。使用替代极值残差分布函数诊断具有离散结果的回归模型。arXiv预打印arXiv:1901.04376v2。
[40] Yang,Y.和Yin,G.(2010年)。具有非ig-缺失数据的纵向研究的贝叶斯分位数回归。生物统计学66,105-114·Zbl 1187.62183号
[41] Zhang,T.和Wang,L.(2020年)。具有不可忽略缺失响应的分位数回归的平滑经验似然推断和变量选择。计算统计学和数据分析。新闻界·兹比尔1504.62059
[42] 赵J.和邵J.(2015)。具有不可忽略缺失数据的广义线性模型中的半参数伪似然。《美国统计协会杂志》110,1577-1590·Zbl 1373.62388号
[43] 赵,H.,赵,P.和唐,N.(2013)。具有不可忽视的缺失响应数据的均值泛函的经验似然推断。计算统计与数据分析66,101-116·Zbl 1471.62233号
[44] Yukun Liu KLATASDS-教育部,华东师范大学统计学院,上海,200241
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。