美文网首页生物信息学与算法
简单直观地理解非负矩阵分解NMF

简单直观地理解非负矩阵分解NMF

作者: 王诗翔 | 来源:发表于2019-01-06 23:06 被阅读9次

我对NMF的理解是一个反反复复的过程,时懂时不懂,因此在这里简单记录下我目前清醒的认知。

NMF图示

NMF的基本思想可以简单描述为:对于任意给定的一个非负矩阵A,NMF算法能够寻找到一个非负矩阵U和一个非负矩阵V,使得满足 ,从而将一个非负的矩阵分解为左右两个非负矩阵的乘积。

分解前后可理解为:原始矩阵V的列向量是对左矩阵W
中所有列向量的加权和,而权重系数就是右矩阵对应列向量的元素,故称W为基矩阵,H为系数矩阵。一般情况下kW矩阵的列数)的选择要比N小,满足(F+N)k < FN,这时用系数矩阵代替原始矩阵,就可以实现对原始矩阵进行降维,得到数据特征的降维矩阵,从而减少存储空间,减少计算机资源。

原矩阵V中的一列向量可以解释为对左矩阵W中所有列向量(称为基向量)的加权和,而权重系数为右矩阵H中对应列向量中的元素。这种基于基向量组合的表示形式具有很直观的语义解释,它反映了人类思维中“局部构成整体”的概念。

比如原矩阵V第2行第4列的红色三角形是由矩阵W的第2行与矩阵H的第4列相乘的结果!

这也就不难理解维基百科中的介绍:

Matrix multiplication can be implemented as computing the column vectors of V as linear combinations of the column vectors in W using coefficients supplied by columns of H.

虽然NMF是一个很厉害的算法,但其实质是加权和,我们可以在原理上等效为基本的线性方程:

y = a_0 + a_1x_1 + a_2x_2 + ... + a_nx_n

y构成了原矩阵中的元素,a系列值是权重,x系列变量是特征。矩阵乘法中特征用列向量表示,权重系数用行向量表示,所以成了图中所看到的样子。

相关文章

网友评论

    本文标题:简单直观地理解非负矩阵分解NMF

    本文链接:https://www.haomeiwen.com/subject/cmwerqtx.html