陈瑞哲;余彻钟;桑吉布·巴苏;施、钱 混合类型数据中实现缺失的诊断测试。 (英语) Zbl 07839703号 Sankhyá,Ser。B类 第1期第86页,第109-138页(2024年). 摘要:在混合分类和定量量表中分析不完全多元测量值时,一个经常关注的问题是完全随机缺失(MCAR)是否是一个合适的模型。已实现的MCAR是指在已实现的缺失数据模式下条件概率的恒定性,不同于通常的MCAR。我们开发了一种可扩展的方法,用于诊断混合类型数据中已实现的MCAR,而现有方法尚缺乏。我们有趣地发现,零框架可以在组件独立性下的更广泛的随机观察(OAR)条件下成立,并且该方法不能检测到独立性下OAR方向的偏离,但可以在依赖性下检测到偏离。我们证明了该方法易于实现且具有可扩展性。在非混合类型数据的特殊情况下,我们面临现有方法的计算困难,而所提出的方法性能优越。该方法用于分析ARCAD转移性结直肠癌数据库中的不完整混合型数据。 理学硕士: 62G10型 非参数假设检验 62-07 数据分析(统计)(MSC2010) 关键词:不完整的数据;随机失踪;不是随机失踪;缺失数据机制测试;混合类型数据;随机观察 PDF格式BibTeX公司 XML格式引用 \textit{R.Chen}等人,Sankhyá,Ser。B 86,编号1,109--138(2024;Zbl 07839703) 全文: 内政部 参考文献: [1] 博季诺夫,II;皮莱,NS;Rubin,DB,诊断多变量数据中的缺失总是随机的,Biometrika,107,1246-2532020·Zbl 1435.62187号 ·doi:10.1093/biomet/asz061 [2] 卡彭特,JR;Smuk,M.,《缺失数据:实践的统计框架》,《生物医学杂志》,63,5915-9472021·兹比尔1523.62098 ·doi:10.1002/bimj.202000196 [3] 陈,HY;Little,JR,关于缺失数据的广义估计方程完全随机缺失的测试,Biometrika,86,1,1-131999·Zbl 1101.62314号 ·doi:10.1093/biomet/86.1.1 [4] De Gramont,A。;Haller,DG;DJ Sargent,《结直肠癌高效试验:阿卡德临床试验计划》,《临床肿瘤学杂志》,2010年第28、4、527-530页·doi:10.1200/JCO.2009.25.2544 [5] 邓,G。;贝尔,我。;Crawley,S.,Braf突变经常出现在甲基化hmlh1的散发性结直肠癌中,但在遗传性非息肉病性结直肠瘤中不存在,临床癌症研究,10,1,191-1952004·doi:10.1158/1078-0432.CCR-1118-3 [6] Fuchs,C.,缺失数据列联表中的最大似然估计和模型选择,美国统计协会J,77,378,270-2781982·doi:10.1080/01621459.1982.1047795 [7] DF Heitjan;Basu,S.,区分“随机失踪”和“完全随机失踪”,《美国统计学家》,50,3,207-2131996·doi:10.1080/00031305.1996.10474381 [8] Jamshidian,M。;Jalal,S.,《不完全多元数据的同方差、正态性和完全随机缺失检验》,《心理测量学》,75,4,649-6742010年·Zbl 1208.62095号 ·doi:10.1007/s11336-010-9175-3 [9] Kim,KH;Bentler,PM,多元不完全数据均值和协方差矩阵的同质性检验,《心理测量学》,67,4,609-6232002·Zbl 1297.62233号 ·doi:10.1007/BF02295134 [10] SS库马尔;价格,TJ;Mohyieldin,O.,Kras g13d突变与大肠癌细胞株模型中对西妥昔单抗或帕尼单抗的敏感性,胃肠道肿瘤研究:GCR,2014年7月1日,23日 [11] 亮氨酸,B。;戈麦斯,M。;Carpenter,JR,《基于试验的成本效益分析中的缺失数据:一段不完整的旅程》,《健康经济学》,2018年第27期,第6期,第1024-1040页·doi:10.1002年12月354日 [12] Li J,Yu Y(2015)不完全多元数据完全随机缺失的非参数检验。心理测量学80(3):707-726·Zbl 1323.62116号 [13] 李伯,R。;潘迪斯,N。;Faggion,CM Jr,《种植牙科中不完整结果数据的报告和处理:随机临床试验调查》,《临床牙周病学杂志》,47,2,257-2662020年·doi:10.1111/jcpe.13222 [14] Lieu,CH;伦弗罗,洛杉矶;De Gramont,A.,转移性结直肠癌患者的年龄与生存率的关系:来自ARCAD临床试验项目的分析,临床肿瘤学杂志,32,27,2975,2014·doi:10.1200/JCO.2013.54.9329 [15] Little R(2020)关于大数据集插补的算法和建模方法。《中国统计》第1685-1696页·Zbl 1464.62533号 [16] Little,RJA,《具有缺失值的多元数据的完全随机缺失检验》,美国统计协会J,83,404,1198-12021988·doi:10.1080/016214519988.10478722 [17] 马里尼,MM;奥尔森,AR;Rubin,DB,缺失数据的面板研究中的最大似然估计,社会学方法,11,314-3571980·doi:10.2307/270868 [18] 米利,F。;DB Rubin,《澄清随机缺失和相关定义,以及与可交换性结合时的含义》,Biometrika,102,4,995-1000,2015·Zbl 1390.62042号 ·doi:10.1093/biomet/asv035 [19] Murray,JS,《多重插补:实践和理论研究成果综述》,《统计科学》,2018年第33、2、142-159页·Zbl 1397.62052号 ·doi:10.1214/18-STS644 [20] Noghrehchi,F。;Stoklosa,J。;Penev,S.,《选择缺失数据多重插补模型:仅使用ic!》!,医学统计,40,10,2467-2497,2021·数字对象标识代码:10.1002/sim.8915 [21] Park T,Davis CS(1993)重复分类数据的缺失数据机制测试。生物统计学第631-638页·Zbl 0800.62687号 [22] 伦弗罗,洛杉矶;Loupakis,F。;Adams,RA,转移性结直肠癌的体重指数预测:ARCAD数据库中一线临床试验患者的汇总分析,临床肿瘤学杂志,34,2,144,2016·doi:10.1200/JCO.2015.61.6441 [23] Rubin,DB,推断和缺失数据,Biometrika,63,3581-5922976·Zbl 0344.62034号 ·doi:10.1093/biomet/63.3.581 [24] Rubin,DB,《调查中无应答的多重插补》,2004年,John Wiley&Sons·2007年6月10日 [25] Ruiz-Banobre,J。;Kandimalla,R。;Goel,A.,转移性结直肠癌的预测性生物标志物:系统综述,JCO精准肿瘤学,2019年3月1日至17日·doi:10.1200/PO.18.00260 [26] 马萨诸塞州塞勒姆;尹,J。;Weinberg,BA,左侧结肠癌和直肠癌患者一线治疗的临床病理学差异和生存结果:来自arcad数据库中agitg(max)、coin、focus2、opus、crystal和coin-b试验的2879名患者的汇总分析,欧洲癌症杂志,103,205-213,2018·doi:10.1016/j.ejca.2018.08.020 [27] DJ Sargent;Buyse,M。;Matheson,A.,《街机临床试验计划:更新和邀请》,《肿瘤学家》,2012年第17、2、188页·doi:10.1634/theoncolist.2011-0332 [28] 肖尔茨,佛罗里达州;斯蒂芬斯,MA,K-sample anderson-darling tests,《美国统计协会杂志》,82,399,918-9241987 [29] Seaman S、Galati J、Jackson D等(2013)“随机失踪”的含义是什么?《统计科学》第257-268页·Zbl 1331.62036号 [30] Van Rooijen,K。;Shi,Q.,同步转移性结直肠癌中原发肿瘤切除的预后价值:来自arcad数据库的一线随机试验的个体患者数据分析,Euro J of cancer,91,99-1062018·doi:10.1016/j.ejca.2017.12.014 [31] 白色,IR;罗伊斯顿,P。;Wood,AM,《使用链式方程进行多重插补:实践问题和指南》,《医学统计》,30,4,377-3992011年·doi:10.1002/sim.4067 [32] Zhang S,Han P,Wu C(2018)检验mcar和后续估计的统一经验似然法。斯堪的纳维亚统计杂志 [33] Zhang,Y.,《随机对照试验中连续结果缺失结果数据参与者的报告质量和最佳处理方法文献的系统调查》,《临床Epi杂志》,88,67-802017年·doi:10.1016/j.jclinepi.2017.05.016 [34] Zhao LP,Lipsitz S,Lew D(1996)使用估计方程进行缺失协变量数据的回归分析。生物统计学第1165-1182页·Zbl 0925.62304号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。