×

非负矩阵分解。 (英语) Zbl 1470.68009号

数据科学丛书宾夕法尼亚州费城:工业和应用数学学会(SIAM)(ISBN 978-1-61197-640-3/pbk;978-1-61117-641-0/电子书)。xxv,350页。(2021).
在这篇综述中,假设所有矩阵都是真实的。对于矩阵(a\),我们写下(a(i,:)和(a(:,j))来表示第(i)行和第(j)列,如果它的所有项都是非负的,则称之为非负的。设(X)是一个(m次n)矩阵。然后著名的奇异值分解(SVD)表明,(X=U\Sigma V^{T})其中,(U)和(V)是正交矩阵,(Sigma)是对角矩阵,其对角项是(X)的奇异值(Sigma_{j})(j=1,2,dots\)。如果\(X\)的秩为\(r\),则\(\sigma_{r}>0\)和\(\sigma_{j}=0\)表示\(j>r\),因此\(X=\sum_{j=1}^{r}\sigma_{j} U型(:,j)V(:,j^{T})是秩为(1)的矩阵的和。对于每一个正整数(k<r),这个和中第一个(k)项的截断和为(X)给出了一个矩阵(X^{(k)}),它是秩(k[G.W.斯图尔特SIAM Rev.35,No.4,551–566(1993;Zbl 0799.01016号)]). 这些对\(X)的低阶近似已用于文本挖掘和图像识别等应用中,但SVD的这种使用并没有考虑到这样一个事实,即通常所分析数据的一个重要属性是众所周知它只考虑非负值。非负矩阵因式分解(NMF)试图考虑这种非负性。
书的1.3节概述了NMF模型如何产生的四个有用示例:从一组图像中提取面部特征;使用像素的光谱特征来从航空照片中识别地理特征;使用词频计数对文档进行分类并识别常见主题;使用音频源分离来识别播放音乐的不同乐器。在每个示例中,输入由矩阵(X)表示,该矩阵的列表示数据点。NMF用于通过乘积(WH)近似(X),其中(X)、(W)和(H)均为非负。基矩阵\(W\)的列与数据点位于同一空间中,权重矩阵\(H\)的列描述了每个数据样本中每个基向量的重要性。
更准确地说,给定一个(m次n)矩阵(X\geq 0),所考虑的基本计算问题是:(精确NMF)对于其中的(s次n),我们可以分别找到大小为(m次s)和(s次n\)的矩阵(W)和(H),这样(*)(X=WH)与(W\geq 0\)和(H\geq0);和(近似)NMF)给定\(s\leq\min(m,n)\)和\(m\times n)矩阵集上的距离函数(D(~,~),最小化\(D(X,WH)\),其中\(W\geq0\)和_(H\geq0 \)的大小分别为\(m\ times)和\。这些问题比使用SVD解决的无约束问题要困难得多。本书的两半部分专门讨论这两个问题。
第1部分(精确因式分解)考察了求解(*)的理论含义。首先出现的一个问题是:(*)有解决方案的\(s)的最小值是多少?这个最小值(表示为\(\operatorname{rank}_{+}(X)\))称为\(X\)的非负秩。清楚地\(\operatorname{rank}(X)\leq\operator名称{等级}_{+}(X)\leq\min(m,n)\)但S.A.瓦瓦西斯[SIAM J.Optim.20,第3期,1364–1377(2009年;Zbl 1206.65130号)]结果表明,确定\(\operatorname{rank}(X)=\operator名称是NP-hard{等级}_{+}(X)),这里有一些例子,其中\(X)具有秩\(3)和\(operatorname{等级}_{+}(X)=\欧米茄(\sqrt{n})\)作为\(n\rightarrow\infty\)。特别是,精确NMF在计算上很困难。此外,与无约束情况不同,如果有一个解决方案,那么通常会有许多截然不同的解决方案。后一个唯一性问题(称为可识别性)可以通过在(W)和(H)上添加更多条件来处理。
第2部分(近似因子分解)转向寻找解,其中(X近似WH);这被简单地称为NMF模型。在这种情况下,我们需要指定距离函数(D(~,~)),并需要添加进一步的条件,以确保问题的解决方案在计算上可行且唯一。以下[D.D.Lee博士H.S.Seong先生,“通过非负矩阵分解学习对象的各个部分”,《自然》401,788–791(1999;doi:10.1038/44565)] 作者倾向于使用基于(β)-发散的距离,对于不同的(β)值,它包括Frobenius范数、分量范数和Kullback-Leibler范数(KL范数更好地匹配非负性条件)。在某些情况下,可能适合要求额外的条件,如(H)的\(ell _{1}\)范数的组件最小化或正交条件,如\(HH^{T}=I\)。下面是一些详细考虑的NMF模型。
对称NMF。在这种情况下,(X)是对称的,我们加上条件(H=W^{T})并用(W\geq0)求解(X近似WW^{T{)。例如,如果\(X\)是图\(\Gamma\)的邻接矩阵,则\(WW^{T}=\sum_{i=1}^{s} W公司(:,i)W(:,i)^{T})是秩为(1)的矩阵的和,表示将(Gamma)分解为团。在一个相关的问题(\(k\)-均值)中,\(X\)中的\(n\)列表示\(m\)-空间中的一组\(\Gamma\)点,我们希望选择\(W(:,\ell)\)(\(\ell=1,\dots,s\)),使得\(\Gamma\)被划分为簇\(\Gamma_{1},\dots,\Gamma_{s}),其中簇\(\Gamma_{\ell})以\(W(:,\ell)\)为中心,并且簇的最大半径尽可能小。
近可分离NMF。据报道,另一类NMF问题的解决方法是使用(W=X(:,mathcal{K})和(H\geq0\)解决\(X=WH\)。这里,(X(:,mathcal{K})表示一个矩阵,它的列等于索引来自(mathcal}K}substeq{1,2,dots,n\})的\(X)的列。我们假设\(s=\left\vert\mathcal{K}\right\vert\)等于\(X\)列生成的cone(\ operatorname{cone}(X)\)的生成器数。第7章描述并分析了有效解决该问题的启发式算法,并表明在一些温和的条件下,该解是唯一的。
NMF的迭代算法。这些方法将(W\geq0)和(H\geq0\)的(D(X,WH))最小化过程视为一系列非线性局部优化问题,其中(W\)和(H \)中的一个被固定,另一个被修改为最小化(D(X,WH。这个过程总是收敛到一个稳定点,但该点不一定是全局最优的。该方法(使用KL-divergence和乘法更新)可以追溯到[W.H.理查森,“基于贝叶斯的图像恢复迭代方法”,J.Opt。Soc.Amer公司。62,第1期,55–59页(1972年;doi:10.364/JOSA.62.0000055);L.B.露西,“校正观测分布的迭代技术”,《天文学》。J.79,745–754(1974年;doi:10.1086/111605)] 它的版本仍然很受欢迎。第8章描述了变化,并对MATLAB中的当前实现进行了比较。
这本书写得很清楚,几何部分的插图也很吸引人。这本书有500多个项目的书目(过去10年大约出版了一半),一个很好的索引和一个重要的注释索引,包括一整页的缩写词。它调查了广泛的材料。各章基本上是独立的,作者会不时停下来进行总结,这很有帮助。本书的两个部分基本上是独立的,似乎是为不同的读者编写的:第1部分讨论了与精确问题的计算复杂性相关的主题,而第2部分集中于解决一系列近似NMF问题的方法的实现。作者有一个网站,提供讨论的所有算法和示例的MATLAB程序(这些似乎也在Octave上运行)。这本书和附带的资源对于学习NMF或考虑针对特定应用实现NMF的任何人都应该很有价值。

MSC公司:

68-02 与计算机科学有关的研究展览会(专著、调查文章)
15-02 线性代数相关研究综述(专著、调查文章)
15A23型 矩阵的因式分解
15个B48 正矩阵及其推广;矩阵的锥
65层55 低阶矩阵逼近的数值方法;矩阵压缩
68T09年 数据分析和大数据的计算方面
68吨10 模式识别、语音识别

软件:

Matlab公司
PDF格式BibTeX公司 XML格式引用
全文: DOI程序