GeoMLA公司 swMATH ID: 41372 软件作者: Hengl,T.、Nussbaum,M.、Wright,M.N.、Heuvelink,G.B.、Gräler,B 描述: GeoMLA,RFsp:随机森林作为空间和时空变量预测建模的通用框架。随机森林和类似的机器学习技术已经用于生成空间预测,但在建模过程中经常忽略点的空间位置(地理)。空间自相关,特别是在交叉验证残差中仍然存在的情况下,表明预测可能有偏差,这是次优的。本文提出了一个随机森林空间预测框架(RFsp),其中以距观测点的缓冲距离作为解释变量,从而将地理邻近效应纳入预测过程。RFsp框架通过使用教科书数据集并将空间和时空预测应用于数值、二进制、类别、多元和时空变量的示例进行了说明。通过五次交叉验证和改装,将RFsp框架的性能与最先进的kriging技术进行了比较。结果表明,与不同版本的kriging相比,RFsp可以获得同样准确和无偏的预测。与克里金法相比,使用RFsp的优点是,它不需要对目标变量的分布和平稳性进行严格的统计假设,它在合并、组合和扩展不同类型的协变量方面更加灵活,并且可能会生成表征预测误差的信息更丰富的映射。RFsp在构建多元空间预测模型方面似乎特别有吸引力,这些模型可以用作各种地球科学领域的“知识引擎”。RFsp的一些缺点是,随着校准数据和协变量的增加,计算强度呈指数级增长,并且预测对输入数据质量的敏感性很高。RFsp框架成功的关键可能是训练数据质量,特别是空间采样的质量(以最大限度地减少外推问题和数据中的任何类型的偏差),以及模型验证的质量(以确保精度不受过拟合的影响)。对于许多数据集,特别是那些点和协变量数量较少且接近线性关系的数据集,基于模型的地质统计学仍然可以比RFsp带来更准确的预测。 主页: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6119462/ 源代码: https://github.com/thengl/GeoMLA网站 依赖项: R(右) 相关软件: 随机ForestSRC;R(右);空间ML;护林员;布里斯克;随机森林;通用乙醇提取物;地理相似性;spBayes公司;spNNGP公司;QSHEP3D公司;随机生存森林;Rborist公司;xgboost公司;CRAN任务视图;随机森林GLS;纳图拉地球;covid19.分析;插入符号;ggplot2 引用于: 5文件 全部的 前5名20位作者引用 1 苏门答腊省巴苏 1 阿比鲁普·达塔 1 帕特丽斯·德·卡里塔特 1 德涅尔·埃尔德莱伊 1 马修·弗里克 1 伊斯特万·加博·哈特瓦尼 1 佐尔坦·科恩 1 梅兰妮·摩西。 1 缪勒,Ute A。 1 杰克·尼科尔 1 塔马斯·尼特拉伊 1 亚历克斯·奥托 1 Luk J.M.Peeters。 1 卡拉·彼得森。 1 马修·彼得森。 1 阿卡杰奥蒂·萨哈 1 宋永泽 1 哈桑·塔勒比 1 雷蒙·托洛萨纳·德尔加多 1 卡尔·杰拉尔德·范登·布加特 4篇连载文章中引用 2 数学地球科学 1 美国统计协会杂志 1 计算与应用数学杂志 1 GEM-国际地球数学杂志 在4个字段中引用 5 统计学(62-XX) 4 计算机科学(68至XX) 4 地球物理学(86-XX) 1 博弈论、经济学、金融和其他社会和行为科学(91-XX) 按年份列出的引文