摘要

缺失数据在各个学科中经常遇到,可分为三类:完全随机缺失(MCAR)、随机缺失(MAR)和非随机缺失(MNAR)。有效的缺失数据统计方法关键取决于对潜在缺失机制的正确识别。尽管测试该机制是MCAR还是MAR的问题已经被广泛研究,但很少有人对MAR与MNAR进行测试。在处理这个问题时面临的一个关键挑战是MNAR下的模型识别问题。在本文中,在失踪概率的逻辑模型下,我们在回归函数的参数模型和半参数定位模型下,对失踪机制是MAR还是MNAR的问题进行了两次得分检验。分数测试的实施绕过了识别问题,因为它只需要在零MAR假设下进行参数估计。我们对人类免疫缺陷病毒数据的模拟和分析表明,分数测试具有控制良好的I型错误和令人满意的能力。

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)
您当前没有访问此文章的权限。