×

GeoMLA公司

swMATH ID: 41372
软件作者: Hengl,T.、Nussbaum,M.、Wright,M.N.、Heuvelink,G.B.、Gräler,B
描述: GeoMLA,RFsp:随机森林作为空间和时空变量预测建模的通用框架。随机森林和类似的机器学习技术已经用于生成空间预测,但在建模过程中经常忽略点的空间位置(地理)。空间自相关,特别是在交叉验证残差中仍然存在的情况下,表明预测可能有偏差,这是次优的。本文提出了一个随机森林空间预测框架(RFsp),其中以距观测点的缓冲距离作为解释变量,从而将地理邻近效应纳入预测过程。RFsp框架通过使用教科书数据集并将空间和时空预测应用于数值、二进制、类别、多元和时空变量的示例进行了说明。通过五次交叉验证和改装,将RFsp框架的性能与最先进的kriging技术进行了比较。结果表明,与不同版本的kriging相比,RFsp可以获得同样准确和无偏的预测。与克里金法相比,使用RFsp的优点是,它不需要对目标变量的分布和平稳性进行严格的统计假设,它在合并、组合和扩展不同类型的协变量方面更加灵活,并且可能会生成表征预测误差的信息更丰富的映射。RFsp在构建多元空间预测模型方面似乎特别有吸引力,这些模型可以用作各种地球科学领域的“知识引擎”。RFsp的一些缺点是,随着校准数据和协变量的增加,计算强度呈指数级增长,并且预测对输入数据质量的敏感性很高。RFsp框架成功的关键可能是训练数据质量,特别是空间采样的质量(以最大限度地减少外推问题和数据中的任何类型的偏差),以及模型验证的质量(以确保精度不受过拟合的影响)。对于许多数据集,特别是那些点和协变量数量较少且接近线性关系的数据集,基于模型的地质统计学仍然可以比RFsp带来更准确的预测。
主页: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6119462/
源代码:  https://github.com/thengl/GeoMLA网站
依赖项: R(右)
相关软件: 随机ForestSRC;R(右);空间ML;护林员;布里斯克;随机森林;通用乙醇提取物;地理相似性;spBayes公司;spNNGP公司;QSHEP3D公司;随机生存森林;Rborist公司;xgboost公司;CRAN任务视图;随机森林GLS;纳图拉地球;covid19.分析;插入符号;ggplot2
引用于: 5文件

按年份列出的引文