INN实现理解——toy_example

作者: 申申申申申申 | 来源:发表于2019-05-29 16:28 被阅读0次

INN实现理解——toy_example
INN实现理解-gaussian_INN
INN实现深入理解
小剧本
2015加州行程
Swiss inn
Downy Inn
Mysql学习笔记：存储引擎MyISAM和InnoDB的区别
MySQL索引的数据结构
MySQL索引实现

github 地址：https://github.com/hagabbar/cINNamon

A Toy Example

1. 设置超参数：

2. 生成数据

^^ 调用函数来生成样本数据，参数 labels 用于限制生成的样本类型，labels 有三种取值：all、some、none，分别对应图 [A Toy Example] 中的三种样本分布；参数 tot_dataset_size 用于指定生成样本的个数。

pos 是一个大小为 (tot_dataset_size, 2) 的二阶矩阵，其元素都符合均值为0，方差为0.2的正态分布，表示样本点的坐标；labels 是一个 (tot_dataset_size, 3) 的矩阵，表示样本点的颜色 RGB 值。样本被均匀分为 8 堆，对每堆的样本坐标进行一定修改，使这堆样本点落在相同区域内，且有相同的颜色。

^^ 分别取 pos、labels 的前 test_split 个元素作为测试样本，画出测试数据的分布图如下：

3. 建立模型

^^ ndim_tot = max(ndim_x, ndim_y+ndim_z) + n_neurons，ndim_tot 的值对网络结构有重要影响，输入结点会将其作为维度值。如果维度 ndim_tot 相对较小，但却需要学习一个很复杂的转换，最好对网络的输入和输出都进行相同数量的 0 填充。这并不会改变输入和输出的固有维度，但使得网络内部层可以以一种更灵活的方式将数据嵌入到更大的表示空间。

^^ ReversibleGraphNet 构造函数会做四件事：
① 构造 INN 网络的正向连接，即：inp → t1 → t2 → t3 → outp。其中 t1、t2、t3 都是一个基础构建块，其结构为：

用公式表示为：

其中，s₁、t₁、s₂、t₂ 都是一种线性映射关系，因此都被构造为一个有三层隐藏层的全连接神经网络。需要说明的是，隐藏层的神经元个数，被简单设置为输出层神经元个数的 2 倍。

② 确定 INN 网络的反向连接，使得可以进行反向训练。
③ 确定正向训练过程中涉及的变量及操作顺序。
④ 确定反向训练过程中涉及的变量及操作顺序。

4. 训练前准备工作

^^ 设置训练参数。

^^ 各项损失的相对权重。INN 训练过程中考虑三项损失：
① 模型输出 y_i = s(x_i) 与网络预测 f_y(x_i) 之间的偏差，损失记为 L_y(y_i，f_y(x_i))，L_y 可以是任意有监督的损失；lamdb_predict 为 L_y 的权重；
② 模型输出 p(y = s(x)) = p(x) / |J_s| 和潜在变量 p(z) 的边际分布的乘积与网络输出 q(y = f_y(x)，z = f_z(x)) = p(x) / |J_yz| 间的偏差，记为 L_z(p(y)p(z)，q(y,z))；lambd_latent 为 L_z 的权重；
③ 输入端的损失 L_x，L_x(p(x)，q(x)) 表示了 p(x) 与后向预测分布 q(x) = p(y = f_y(x)) p(z = f_z(x)) / |J_x| 间的偏差；lambd_rev 为 L_x 的权重.