Python和R:MIDASpy和rMIDAS中多样数据的高效多重插补

兰吉特·拉尔 托马斯·罗宾逊

主要文章内容

摘要

本文介绍了使用Python(MIDASpy)和R(rMIDAS)中的深度学习方法高效输入缺失数据的软件包。这些软件包实施了一种最近开发的多重插补方法,称为MIDAS,该方法涉及在数据集中引入额外的缺失值,试图用一种称为去噪自动编码器的无监督神经网络重建这些值,以及使用所得到的模型来绘制原始缺失数据的输入。这些步骤是通过一种快速灵活的算法来执行的,该算法扩展了可以用多重插补进行分析的数据的数量和范围。为了帮助用户针对其特定应用优化算法,MIDASpy和rMIDAS提供了一系列用户友好的工具,用于校准和验证插补模型。我们提供了这些功能的详细指南,并演示了它们在大型真实数据集上的使用。

文章详细信息

文章提要栏