×

关于数据中可能缺少响应变量的回归和分类。 arXiv公司:2212.02867

预印本,arXiv:22212.02867[math.ST](2022)。
摘要:本文考虑了数据中可能不可观测响应变量的核回归和分类问题,其中导致信息缺失的机制未知,并且可能依赖于预测因子和响应变量。我们提出的方法包括两个步骤:第一步,我们构造了一系列模型(可能是无限维的),这些模型以缺失概率机制的未知参数为索引。在第二步中,在最小化均方预测误差的意义下,进行搜索以找到基础族的适当覆盖(或子类)的经验最优成员。本文的重点是研究这些估计量的理论性质。还讨论了可识别性问题。我们的方法使用一种很容易实现的数据分割方法。我们还根据其与一般Lp范数中真实回归曲线的偏差,导出了结果估计的性能的指数界,其中我们还允许覆盖或子类的大小随着样本大小n的增加而发散。这些界立即产生了所提出估计的各种强收敛结果。作为我们研究结果的一个应用,我们考虑了基于所提出的回归估计量的统计分类问题,并研究了它们在不同设置下的收敛速度。虽然这项工作主要针对核型估计量,但它们也可以扩展到其他流行的局部平均方法,如最近邻估计量和直方图估计量。
BibTeX公司 引用
全文: arXiv公司
arXiv数据来自arXiv OAI-PMH API.如果你发现了错误,请直接向arXiv报告.