罗德里克·利特尔。 关于大数据集插补的算法和建模方法。 (英语) Zbl 1464.62533号 统计正弦。 30,第4期,1685-1696(2020). 摘要:机器学习和统计建模文化为统计分析提供了对比方法。在本刊的一篇文章中,W.-Y.Loh先生等【Stat.Sin.29,No.1,431-453(2019;Zbl 1412.62080号)]在设置大数据集插补时比较这些方法,推荐机器学习方法。所有比较的方法都会做出假设,我注意到,与基于树的机器学习方法相比,基于模型的方法对这些假设的评估更为关键。我特别讨论了不同方法所隐含的关于缺失数据机制的假设。考虑到抛弃不完整案例的方法的相对强大性能,以及对相关设计空间的有限探索,我质疑从模拟研究中得出一般结论的程度。 MSC公司: 62兰特 大数据和数据科学的统计方面 62H30型 分类和区分;聚类分析(统计方面) 62D10号 缺少数据 68T05型 人工智能中的学习和自适应系统 关键词:插补;缺少数据;机器学习;无响应加权;树和森林方法 引文:Zbl 1412.62080号 PDF格式BibTeX公司 XML格式引用 \textit{R.J.Little},统计罪。30,第4号,1685--1696(2020;Zbl 1464.62533) 全文: 内政部 链接