×

子空间采样和相对误差矩阵近似:基于列的方法。 (英文) Zbl 1131.68589号

Azar,Yossi(编辑)等人,《算法——欧空局2006》。第14届欧洲年会,瑞士苏黎世,2006年9月11-13日。诉讼程序。柏林:施普林格出版社(ISBN 978-3-540-38875-3/pbk)。计算机科学讲稿4168304-314(2006)。
摘要:理论计算机科学、线性代数和机器学习领域的许多最新工作都考虑了以下形式的矩阵分解:给定一个(m乘n)矩阵(A),将其分解为三个矩阵(C,U)和(R)的乘积,其中(C)由少量的(A,R)列组成由少量的\(a\)行组成,并且\(U \)是一个精心构造的小矩阵,可以确保乘积CUR“接近”\(a\.)。这种分解的应用包括矩阵“草图”的计算,加快基于核的统计学习,保持低秩矩阵表示的稀疏性,以及提高数据分析方法的可解释性。我们的主要结果是一个随机多项式算法,该算法将一个(m乘n)矩阵(a)作为输入,并将其作为输出矩阵(C,U,R)返回,从而\[\|{A-CUR}(1+\epsilon)\]概率至少为(1-\delta)。这里,(A{k})是“最佳”秩-(k)近似(通过截断(A\)的奇异值分解提供),而|\(|X||{F})则是矩阵(X\)的Frobenius范数。(C)中的列数和(R)中的行数是(k,1/\epsilon)和(log(1/\delta))中的低次多项式。我们的主要结果是通过将我们最近的(ell_2})回归的相对误差近似算法从过约束问题推广到一般回归问题而得到的。我们的算法很简单,计算(A)的右上奇异向量所需的时间与所需时间的数量级相当。此外,它通过“子空间采样”方法对\(A\)的列和行进行采样,因为采样概率取决于顶部奇异向量行的长度,并且因为它们确保我们完全捕获感兴趣的某个子空间,所以命名为。
关于整个系列,请参见[Zbl 1130.68002号].

MSC公司:

68瓦20 随机算法
62D05型 抽样理论、抽样调查
68T05型 人工智能中的学习和自适应系统
68周25 近似算法

软件:

算法844
PDF格式BibTeX公司 XML格式引用
全文: 内政部