×

基于似然的交叉验证的渐近最优性。 (英语) Zbl 1038.62040号

摘要:基于似然的交叉验证是一种统计工具,用于从一组候选密度估计器中的真实密度中,根据身份验证观察结果选择密度估计值。一般示例包括选择模型索引最大似然估计量,以及选择带宽索引非参数(例如,核)密度估计量。我们为一类基于相似性的交叉验证程序建立了一个有限样本结果(根据所使用的样本分割类型进行索引,例如,(V)-折叠交叉验证)。这一结果表明,交叉验证选择器作为基准模型选择器(相对于Kullback-Leibler到真实密度的距离)也具有渐近性能,它对每个给定数据集都是最优的,并且取决于真实密度。
我们定理的关键条件是验证样本的大小收敛到无穷大,这不包括未经验证的交叉验证,并且候选密度估计值远离零和无穷大。我们通过仿真研究说明了这些渐近结果和基于似然的交叉验证在带宽选择方面的实际性能。此外,我们在DNA序列中检测调控基序的背景下使用基于相似性的交叉验证。

MSC公司:

62G07年 密度估算
第62页第10页 统计学在生物学和医学中的应用;元分析
92C40型 生物化学、分子生物学
6220国集团 非参数推理的渐近性质
PDF格式BibTeX公司 XML格式引用
全文: 链接