×

用于缺失响应的分类数据分析的产品多项式框架。 (英语) Zbl 1426.62012年

小结:为了分析缺少答案的分类数据,我们扩展了第三作者[REBRAPE 5,No.1,1-42(1991;Zbl 0729.62638号)]到一个允许包含解释变量的产品-多项式框架。我们考虑了最大似然(ML)和加权最小二乘(WLS)以及混合ML/WLS方法,以在可忽略和不可忽略的缺失数据机制下拟合线性、对数线性和更一般的函数线性模型。我们用统一的矩阵表示法表示结果,这种方法可以方便地用于计算实现,并在R中开发了这样一组子程序。我们用两个数据集的分析来说明程序,并进行仿真以评估估计量的特性。

MSC公司:

62-08 统计问题的计算方法
62甲12 多元分析中的估计
62层30 约束条件下的参数化推理

软件:

R(右)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Agresti,A.(2002年)。分类数据分析,第二版,纽约:Wiley·Zbl 1018.6202号
[2] Azzalini,A.(1994年)。应用于重复测量的自相关数据的Logistic回归。生物特征81767-775·Zbl 0825.62852号 ·doi:10.1093/biomet/81.4.767
[3] 贝克·S·G(1994)。缺失数据:不完整多项式数据的复合线性模型。医学统计学13609-622。
[4] Baker,S.G.和Laird,N.M.(1988年)。分类变量的回归分析,结果受不可忽视的无反应影响。美国统计协会杂志83,62-69;勘误表1232。
[5] Berndt,E.R.、Hall,B.H.、Hall,R.E.和Hausman,J.A.(1974年)。非线性结构模型中的估计和推断。《经济和社会计量年鉴》3,653-666。
[6] Blumenthal,S.(1968年)。部分分类数据的多项式抽样。《美国统计协会杂志》,第63/542-551页·Zbl 0159.48403号 ·doi:10.2307/2284025
[7] Chen,T.T.和Fienberg,S.E.(1974年)。包含完全和部分交叉分类数据的二维列联表。生物统计学30,629-642·Zbl 0294.62073号 ·doi:10.2307/2529228
[8] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法获得不完整数据的最大可能性(带注释)。皇家统计学会杂志。乙39,1-38·Zbl 0364.62022号
[9] Fuchs,C.(1982)。缺失数据列联表中的最大似然估计和模型选择。《美国统计协会杂志》77270-278。
[10] Grizzle,J.E.、Starmer,C.F.和Koch,G.G.(1969年)。用线性模型分析分类数据。生物统计学25,489-504·Zbl 1149.62317号 ·doi:10.2307/2528901
[11] Hocking,R.R.和Oxspring,H.H.(1971)。不完全多项式数据的最大似然估计。美国统计协会杂志66,65-70·Zbl 0219.62004号 ·doi:10.2307/2284849
[12] Imrey,P.B.、Koch,G.G.、Stokes,M.E.、Darroch,J.N.、Freeman,D.H.Jr.和Tolley,H.D.(1981)。分类数据分析:对对数线性模型和逻辑回归的一些思考。第一部分:历史和方法概述。《国际统计评论》49,265-283·兹伯利0478.62003 ·doi:10.2307/1402613
[13] Imrey,P.B.、Koch,G.G.、Stokes,M.E.、Darroch,J.N.、Freeman,D.H.Jr.和Tolley,H.D.(1982)。分类数据分析:对对数线性模型和逻辑回归的一些思考。第二部分:数据分析。《国际统计评论》50,35-63·Zbl 0508.62005号 ·doi:10.2307/1402458
[14] Kenward,M.G.和Molenberghs,G.(1998年)。当数据随机丢失时,基于可能性的频率学家推断。统计科学13236-247·Zbl 1099.62503号 ·doi:10.1214/ss/1028905886
[15] Kenward,M.G.、Goetghebeur,E.和Molenberghs,G.(2001年)。不完整分类数据的敏感性分析。统计建模1,31-48·Zbl 0983.62078号 ·doi:10.1191/147108201128078
[16] Koch,G.G.、Imrey,P.B.和Reinfurt,D.W.(1972年)。不完全响应向量分类数据的线性模型分析。生物统计学28,663-692。
[17] Landis,J.R.、Stanish,W.M.、Freeman,J.L.和Koch,G.G.(1976年)。使用加权最小二乘法对分类数据进行广义齐方分析的计算机程序(GENCAT)。生物医学中的计算机方法和程序6196-231。
[18] Lipsitz,S.R.和Fitzmaurice,G.M.(1996)。缺失数据的列联表的独立性得分测试。生物统计学52,751-762·Zbl 0875.62234号 ·doi:10.2307/2532915
[19] Lipsitz,S.R.、Laird,N.M.和Harrington,D.P.(1994年)。重复分类测量的加权最小二乘分析,结果无反应。生物统计学50,11-24·Zbl 0826.62082号 ·doi:10.2307/2533193
[20] Little,R.J.A.和Rubin,D.B.(2002年)。缺失数据的统计分析,第二版,纽约:Wiley·Zbl 1011.62004号
[21] Molenberghs,G.、Beunckens,C.、Sotto,C.和Kenward,M.G.(2008年)。每个非随机缺失模型都有一个匹配度相等的随机缺失对应物。皇家统计学会杂志。乙70,371-388·Zbl 1148.62046号 ·doi:10.1111/j.1467-9868.2007.00640.x
[22] Molenberghs,G.和Goetghebeur,E.(1997年)。不完全分类数据的简单拟合算法。皇家统计学会杂志。B 59,401-414·Zbl 0886.62062号
[23] Molenberghs,G.、Goetghebeur,E.、Lipsitz,S.R.和Kenward,M.G.(1999年)。分类数据中的非随机缺失:优势和局限性。美国统计学家53,110-118。
[24] Paulino,C.D.(1991)。不完全分类数据的分析:条件最大似然法和加权最小二乘法的调查。巴西概率统计杂志5,1-42·Zbl 0729.62638号
[25] Paulino,C.D.和Silva,G.L.(1999)。分类数据中一般线性模型的最大似然分析。计算统计与数据分析30197-204·Zbl 1061.62544号
[26] Paulino,C.D.和Soares,P.(2003)。不完全泊松数据中的速率分析。统计学家52,87-99。
[27] Poleto,F.Z.(2006)。缺失的分类数据分析。圣保罗大学理科硕士论文(葡萄牙语)。
[28] Poleto,F.Z.、Singer,J.M.和Paulino,C.D.(2011年a)。缺失数据机制及其对分类数据分析的影响。统计与计算21,31-43·Zbl 1274.62652号
[29] Poleto,F.Z.、Paulino,C.D.、Molenberghs,G.和Singer,J.M.(2011年b)。过度参数化的推理含义:不完全分类数据的案例研究。《国际统计评论》79,92-113。
[30] R开发核心团队(2012年)。R: 统计计算语言和环境。维也纳:R统计计算基金会。
[31] Rubin,D.B.(1976年)。推断和缺失数据。生物特征63,581-592·Zbl 0344.62034号 ·doi:10.1093/biomet/63.3.581
[32] Rubin,D.B.(1987)。调查中无应答的多重插补。纽约:Wiley·2007年6月10日
[33] Schafer,J.L.(1997)。不完全多元数据分析。博卡拉顿:查普曼和霍尔·Zbl 0997.62510号
[34] Vansteelandt,S.、Goetghebeur,E.、Kenward,M.G.和Molenberghs,G.(2006年)。在敏感性分析中,无知和不确定性区域作为推断工具。中国统计局16,953-979·Zbl 1108.62005号
[35] Williamson,G.D.和Haber,M.(1994年)。具有完全和部分交叉分类数据的三维列联表模型。生物统计学49,194-203·Zbl 0825.62493号 ·doi:10.2307/2533209
[36] Woolson,R.F.和Clarke,W.R.(1984)。分类不完整纵向数据分析。英国皇家统计学会期刊,Ser。A 14787-99。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。