毛晓军;陈、宋熙;Raymond K.W.Wong。 矩阵完成与协变量信息。 (英语) Zbl 1478.62122号 美国统计协会。 114,第525号,198-210(2019). 摘要:本文研究了当额外的协变量可用时,从损坏的数据中完成矩阵的问题。尽管在矩阵完成文献中很少考虑,但这些协变量通常为完成高维目标矩阵的未观察条目提供有价值的信息{答}_{0}\). 给定一个协变量矩阵(mathbf{X}),其行表示(mathbf)的行协变量{答}_{0}\),我们考虑一个列空间分解模型\(\mathbf{答}_{0}=\mathbf{X}\boldsymbol{\beta}_{0}+\mathbf{B}_{0}),其中\(\boldsymbol{\beta}{0}\)是系数矩阵,\(\mathbf{B}_{0}\)是一个低秩矩阵,在列空间方面与\(mathbf{X}\)正交。该模型有助于明确区分可解释的协变量效应((mathbf{X}\boldsymbol{beta}_{0})和灵活的隐藏因子效应(mathbf{B}_{0})\)。此外,我们的工作允许观测概率依赖于协变量矩阵,因此允许出现遗漏随机机制。我们提出了一种新的(mathbf)惩罚估计{答}_{0}\)通过利用Frobenius范数和核范数正则化以及高效且可扩展的算法。研究了所提出估计量的渐近收敛速度。通过数值实验和实际数据应用,说明了所提出方法的经验性能。 引用于8文件 MSC公司: 62甲12 多元分析中的估计 关键词:高维统计;低秩估计;缺少数据;核范数正则化 软件:插补;电影镜头;softImpute软件 PDF格式BibTeX公司 XML格式引用 \textit{X.Mao}等人,《美国统计协会期刊》第114期,第525、198-210号(2019年;Zbl 1478.62122) 全文: 内政部 链接 参考文献: [1] 阿伯内西,J。;巴赫,F。;Evgeniou,T。;Vert,J.-P.,《协作过滤的新方法:带谱正则化的算子估计》,《机器学习研究杂志》,第10期,第803-826页(2009年)·Zbl 1235.68122号 [2] Bi,X。;Qu,A。;Wang,J。;沈欣,《群体特定推荐系统》,《美国统计协会杂志》,第112期,第1344-1353页(2016年) [3] 蔡,T。;Cai,T.T。;Zhang,A.,《结构化矩阵完备性及其在基因组数据集成中的应用》,美国统计协会杂志,111621-633(2016) [4] Cai,T.T。;周文新,基于最大形式约束优化的矩阵完备性,电子统计杂志,101493-1525(2016)·Zbl 1342.62091号 [5] 坎迪斯,E.J。;Plan,Y.,《有噪声的矩阵完成》,IEEE会议记录,98925-936(2010) [6] 坎迪斯,E.J。;Recht,B.,通过凸优化实现精确矩阵补全,计算数学基础,9717-772(2009)·Zbl 1219.90124号 [7] Chiang,K.-Y.,Hsieh,C.-J.和Dhillon,I.S.(2015),“带有噪声侧信息的矩阵完成”神经信息处理系统研究进展, 28, 3447-3455. [8] Feuerverger,A。;何毅。;Khatri,S.,《Netflix挑战的统计意义》,《统计科学》,第27期,第202-231页(2012年)·Zbl 1330.62090号 [9] Freedman,D.A.,《统计模型:理论与实践》(2009),纽约:剑桥大学出版社,纽约·Zbl 1167.62001 [10] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,《统计学习的要素》(2013),纽约:施普林格出版社,纽约 [11] Gross,D.,从任何基础上的少量系数中恢复低秩矩阵,IEEE信息理论汇刊,57/1548-1566(2011)·Zbl 1366.94103号 [12] Halko,N。;Martinsson,P.-G。;Tropp,J.A.,《寻找随机结构:构造近似矩阵分解的概率算法》,SIAM Review,53,217-288(2011)·Zbl 1269.65043号 [13] Harper,F.M.和Konstan,J.A.(2016),《电影镜头数据集:历史与背景》交互式智能系统(TiiS)ACM交易, 5, 19:1-19:19. [14] Keshavan,R.H.、Montanari,A.和Oh,S.(2009),“噪音条目的矩阵完成”神经信息处理系统研究进展, 22, 952-960. [15] Klopp,O.,一般抽样分布的噪声低秩矩阵完备,伯努利,20228-303(2014)·Zbl 1400.62115号 [16] 科尔钦斯基,V。;Lounici,K。;Tsybakov,A.B.,《核形式惩罚与低噪声矩阵完成的最优速率》,《统计年鉴》,392302-2329(2011)·Zbl 1231.62097号 [17] Little,R.J。;Rubin,D.B.,《缺失数据的统计分析》(2014年),新泽西州霍博肯:新泽西州威利 [18] 马,S。;Goldfarb,D。;Chen,L.,矩阵秩最小化的不动点和Bregman迭代方法,数学规划,128,321-353(2011)·Zbl 1221.65146号 [19] Mardia,K.V。;Kent,J.T。;Bibby,J.M.,多元分析(1980),伦敦:学术出版社,伦敦·Zbl 0432.62029号 [20] Mazumder,R。;哈斯蒂,T。;Tibshirani,R.,学习大型不完全矩阵的谱正则化算法,机器学习研究杂志,112287-2322(2010)·Zbl 1242.68237号 [21] Natarajan,N。;Dhillon,I.S.,用于预测基因疾病关联的归纳矩阵完成,生物信息学,30,i60-i68(2014) [22] 内加班,S。;Wainwright,M.J.,《受限强凸性与加权矩阵完备:带噪声的最优界》,《机器学习研究杂志》,第13期,1665-1697页(2012)·Zbl 1436.62204号 [23] Oh,T.-H.,Matsushita,Y.,Tai,Y.-W.和Kweon,I.S.(2015),《核规范最小化的快速随机奇异值阈值》IEEE计算机视觉和模式识别会议记录第4484-4493页。 [24] Recht,B.,《矩阵完成的更简单方法》,《机器学习研究杂志》,12,3413-3430(2011)·Zbl 1280.68141号 [25] 罗德,A。;Tsybakov,A.B.,《高维低秩矩阵估计》,《统计年鉴》,39,887-930(2011)·Zbl 1215.62056号 [26] Srebro,N.和Salakhutdinov,R.R.(2010),“非统一世界中的协作过滤:使用加权跟踪规范进行学习”神经信息处理系统研究进展, 23, 2056-2064. [27] Sun,T.和Zhang,C.-H(2012),“矩阵完备中的校准弹性正则化”神经信息处理系统研究进展, 25, 863-871. [28] Sweeting,T.,最大似然估计的一致渐近正态性,统计年鉴,81375-1381(1980)·Zbl 0447.62041号 [29] 俄勒冈州特罗扬斯卡娅。;康托,M。;Sherlock,G。;布朗,P。;哈斯蒂,T。;Tibshirani,R。;博茨坦,D。;Altman,R.B.,DNA微阵列缺失值估计方法,生物信息学,17,520-525(2001) [30] Xu,M.,Jin,R.和Zhou,Z.-H.(2013),“带辅助信息的加速矩阵完成:在多标签学习中的应用,”神经信息处理系统研究进展, 26, 2301-2309. [31] Zhu,Y。;沈,X。;Ye,C.,《潜在因素模型中的个性化预测和稀疏性追求》,美国统计协会杂志,111241-252(2016) [32] Zou,H.和Hastie,T.(2005),“通过弹性网的正则化和变量选择”英国皇家统计学会杂志,B系列,67,301-320·Zbl 1069.62054号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。