非负矩阵分解(NMF)也是一种无监督算法,其目的在于提取有用的特征。它的工作原理类似于PCA,也可以用于降维。与PCA相同,我们试图将每个数据点写成一些分量的加权求和。但在PCA中,我们想要的是正交分量,并且能够解释尽可能多的数据方差;而在NMF中,我们希望分量和系数均为非负,也就是说,我们希望分量和系数都大于或等于0.因此,这种方法只能应用与每个特征都是非负的数据,因为非负分量分非负求和不可能为负值。
将数据分解成非负加权求和的这个过程,对由多个独立源相加(或叠加)创建而成的数据特别有用,比如多人说话的音轨或包含多种乐器的音乐。在这种情况下,NMF可以识别出组成合成数据的原始分量。总的来说,与PCA相比,NMF得到的分量更容易解释,因为负的分量和系数可能会导致难以解释的抵消效应。