×

不完全二进制数据的一种新插补方法。 (英语) Zbl 1215.62001号

摘要:在数据分析问题中,数据由实数向量表示,通常情况下,一些数据点将具有“缺失值”,这意味着描述数据点的向量的一个或多个条目未被观察到。我们提出了一种新的缺失二进制值插补方法。我们引入的技术采用了由M.安东尼P.L.锤子[同上,154,第16号,2242–2246(2006年;Zbl 1106.94025号)]. 我们通过实验比较了我们的技术与基于常用汉明距离测量和多重插补的技术的性能。

理学硕士:

62-07 数据分析(统计)(MSC2010)
94立方厘米 交换理论,布尔代数的应用;布尔函数(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安东尼,M。;Hammer,P.L.,《布尔相似性度量》,《离散应用数学》,第2卷,第16卷,第2242-2246页(2006年),(另见RUTCOR研究报告RRR-27-2004,RUTCOR,罗格斯大学罗格斯运筹中心,新泽西州,2004年8月。)·Zbl 1106.94025号
[2] Boros,E。;Hammer,P.L。;茨城,T。;Kogan,A.,数字数据的逻辑分析,数学规划,79,163-190(1997)·Zbl 0887.90179号
[3] Boros,E。;哈默,P.L。;茨城县。;Kogan,A。;Mayoraz,E。;Muchnik,I.,《数据逻辑分析的实现》,IEEE知识与数据工程汇刊,12,1,292-306(2000)
[4] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中获取最大似然》,英国皇家统计学会杂志。系列B,39,1,1-38(1977)·Zbl 0364.62022号
[5] 格陵兰,南部。;Finkle,W.D.,《流行病学回归分析中缺失协变量处理方法的批判性研究》,《美国流行病学杂志》,1421255-1264(1995)
[6] Herring,A.H。;Ibrahim,J.G.,Cox比例风险模型中缺失协变量的基于似然的方法,美国统计协会杂志,96,292-302(2001)·Zbl 1014.62112号
[7] 易卜拉欣,J.G.,广义线性模型中的不完全数据,美国统计协会杂志,85,411,765-769(1990)
[8] 易卜拉欣,J.G。;Weisberg,S.,具有连续协变量的广义线性模型中的不完全数据,澳大利亚统计杂志,34461-470(1992)·Zbl 0825.62604号
[9] 易卜拉欣,J.G。;Chen,M.H。;Lipsitz,S.R.,参数回归模型中缺失协变量的蒙特卡罗EM,生物统计学,55,2,591-596(1999)·Zbl 1059.62662号
[10] 易卜拉欣,J.G。;Chen,M.H。;Lipsitz,S.R.,当缺失数据机制不可忽略时广义线性混合模型中的缺失响应,Biometrika,88,551-564(2001)·Zbl 0984.62047号
[11] 易卜拉欣,J.G。;利普西茨,S.R。;Chen,M.H.,当缺失数据机制不可忽略时,广义线性模型中的缺失协变量,皇家统计学会期刊,B辑,61173-190(1999)·Zbl 0917.62060号
[12] Little,R.A.,缺失(X)s的回归;综述,《美国统计协会杂志》,871227-1237(1992)
[13] Little,R.J.A。;Rubin,D.B.,《缺失数据的统计分析》(1987),John Wiley&Sons:John Willey&Sons New York·Zbl 0665.62004号
[14] 麦克拉克伦,G。;Krishnan,T.,《EM算法和扩展》(The EM Algorithm and Extensions)(1996年),约翰·威利父子公司:约翰·威利母子公司纽约
[15] Roth,P.,《缺失数据:应用心理学家的概念综述》,《人事心理学》,47537-560(1994)
[16] Rubin,D.B.,《调查中无应答的多重插补》(1987),John Wiley&Sons:John Willey&Sons纽约·2007年6月10日
[17] SAS Institute Inc.,SAS 9.1.3帮助和文件,北卡罗来纳州卡里:SAS Institute Inc.,2002-2004年。;SAS Institute Inc.,SAS 9.1.3帮助和文档,北卡罗来纳州卡里:SAS Institution Inc.,2002-2004年。
[18] Schafer,J.L.,《不完全多元数据分析》(1997),查普曼和霍尔出版社,CRC出版社:查普曼与霍尔出版社,伦敦CRC出版社·Zbl 0997.62510号
[19] 苏巴西,M。;苏巴西,E。;安东尼,M。;Hammer,P.L.,《使用相似性度量进行可信分类》,《离散应用数学》,157,5,1104-1112(2009)·Zbl 1186.68394号
[20] 加州大学欧文分校机器学习库。网址:http://www.ics.uci.edu/mlearn/MLRepository.html;加州大学欧文分校机器学习库。网址:http://www.ics.uci.edu/mlearn/MLRepository.html
[21] Vach,W.,协变量中缺失值的Logistic回归(1994),Springer:Springer纽约·Zbl 0801.62061号
[22] Y.C.Yuan,《缺失数据的多重插补:概念和新发展SAS/STAT 8.2》,SAS Institute Inc.,北卡罗来纳州卡里,2001年。请参见:http://www.sas.com/统计; Y.C.Yuan,《缺失数据的多重插补:概念和新发展SAS/STAT 8.2》,SAS Institute Inc.,Cary,NC,2001年。请参见:http://www.sas.com/statistics网站
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。