×

空间数据密度估计的带宽选择。 (英语) Zbl 07554775号

摘要:在探索非高斯复杂空间数据的空间核估计中,带宽选择至关重要。本文研究了在空间格上给定数据的情况下,用于密度估计的自适应和非自适应带宽的选择。自适应带宽取决于本地数据,因此自适应地符合空间数据的本地特征。我们提出了一种全局带宽的空间交叉验证(SCV)选择。这首先通过自适应带宽表达式中涉及的导频密度来完成。建立了该过程的最优性,并证明了非自适应带宽选择是一种特殊情况。尽管交叉验证思想在独立数据和时间序列数据的数据驱动平滑中选择非自适应带宽时很流行,但其理论和应用在空间数据方面的研究还不多。对于自适应情况,甚至对于独立数据也几乎没有理论。推导了确保SCV所选带宽渐近最优的条件,实际上还扩展了时间序列和独立数据最优结果。此外,对于具有估计导频密度的自适应带宽,在已知真实导频的情况下,渐近地获得了合成密度估计器的预言性质。数值模拟表明,SCV自适应带宽选择的有限样本性能非常好。它优于现有的R例程,例如“经验法则”和所谓的“第二代”Sheather-Jones带宽,适用于中等和大数据集。进一步对一组空间土壤数据进行了实证应用,显著识别了非高斯特征。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接