dataprep:高效灵活的数据预处理工具

使用一组数据过滤、删除和插值工具高效灵活地预处理数据。这些数据预处理方法是基于完整性、准确性、阈值法和线性插值的原则,通过设置约束条件、时间完成和恢复以及快速高效的计算和分组而开发的。关键的预处理步骤包括删除变量和观测值、剔除离群值和缺失值(NA)插值,这取决于原始数据的不完整程度和分散程度。与普通方法相比,它们更准确地清理数据,保留更多样本,插值后不添加离群值。通过基于游程的分组对连续NA进行自动识别,用于删除观测值、剔除异常值和NA插值;因此,在插值过程中不会生成新的离群值。提出条件极值法实现逐点加权离群点剔除,避免了非离群点的剔除。此外,在短时间内引用值的时间序列插值进一步确保了插值的可靠性。这些方法基于并改进了参考文献:Liang,C.-S.,Wu,H.,Li,H.-Y.,Z.,Li和He,K.-B.(2020)<doi:10.1016/j.scitotenv.2020.140923>.

版本: 0.1.5
取决于: R(≥3.5.0)
进口: ggplot2,规模,foreach公司,do并行,dplyr公司,重塑2,数据表,动物园
建议: 针织物,rmarkdown公司
出版: 2022-01-15年
作者: 梁春生、吴浩、李海燕、张强、李占清、何可斌、兰州大学、清华大学
维护人员: 梁春生<梁春生在lzu.edu.cn>
许可证: GPL-2型|GPL-3型[扩展自:GPL(≥2)]
需要编译:
CRAN检查: 数据准备结果

文档:

参考手册: 数据准备.pdf
渐晕图: dataprep:数据预处理和绘图

下载内容:

包源: 数据准备_0.1.5.tar.gz
Windows二进制文件: r-预发布:dataprep_0.1.5.zip,r版本:dataprep_0.1.5.zip,r-oldrel:dataprep_0.1.5.zip
macOS二进制文件: r-prerel(arm64):数据准备0.1.5.tgz,r-release(arm64):数据准备0.1.5.tgz,r-oldrel(臂64):数据准备0.1.5.tgz,r-prerel(x86_64):数据准备0.1.5.tgz,r-release(x86_64):数据准备0.1.5.tgz
旧来源: 数据准备存档

链接:

请使用规范形式https://CRAN.R-project.org/package=dataprep链接到此页面。