主页

论文

提交文件

新闻

编辑委员会

开源软件

程序(PMLR)

交易(TMLR)

搜索

统计

登录

常见问题

联系我们



RSS源

具有稀疏不匹配数据的多元线性回归的两阶段方法

马丁·斯拉夫斯基、伊曼纽尔·本·达维德、李萍; 21(204):1−42, 2020.

摘要

线性回归中的一个默认假设是(响应、预测)-对对应于相同的观测单位。最近的一系列工作研究了在“无标记感知”和“未知排列的回归”等术语下违反这一假设的情况。在本文中,我们研究了多响应变量的设置和一个不匹配的概念,该概念推广了排列,以允许丢失匹配以及一对多匹配。在假设大多数配对正确匹配的前提下,提出了一种两阶段方法。在第一阶段,通过将不匹配作为污染处理来估计回归参数,然后通过匹配的基本变量来估计广义置换。该方法计算方便,并具有良好的统计保证。具体地说,随着每个观测值的响应数$m$的增加,排列恢复的条件变得不那么严格。特别是,对于$m=\Omega(\log n)$,所需的信噪比不再取决于样本大小$n$。给出了合成数据和实际数据的数值结果,以支持我们分析的主要结果。

[腹肌][pdf格式][围兜]      
©JMLR公司2020(编辑,贝塔)