0.背景
【论文地址】
我正在研究BNN(贝叶斯网络)的工作,而这篇文章提到的几个概念对这一研究,极为重要。这里截取论文的几部分加以整理。
1.probabilistic hypernetwork(超网络)
定义:NN(神经网络,后文同用这一简称)的参数为另一NN产生。
例如,,其中的参数
为另一网络
的输出。假如我们用两层NN,示意图就是下面这样。

其中和分别是和的概率密度函数。
【不得不说这玩意和Attention很像。】
(主干)网络参数的联合概率密度为:
2.matrix variate normal(矩阵正态分布)
【你看的没错,不是multivariate,是matrix variate。二者差别不大】
其中vec表示将某矩阵排成一列(vectorization,向量化),叉乘表示克罗内克积,都是向量。
其中就是第
层的参数,它的先验为:
3. 损失
其中是单位矩阵。
4.重参数化
如果 ,则
5.算法

网友评论