无监督学习的举例:1. K-means,2. PCA主成分分析(Principal Component Analysis,降维Dimensionality reduction),3. Autoencoders(Feature learning) 4. Density estimation
data:image/s3,"s3://crabby-images/3b4e6/3b4e609219af8cc00b240884ecb1cf9de8a7af28" alt=""
对于输入数据,有一个重构的数据作为输出。
data:image/s3,"s3://crabby-images/fe198/fe198227bb0fd82c18b87c92d4b7d303f4e41873" alt=""
有监督学习VS无监督学习
data:image/s3,"s3://crabby-images/16d9b/16d9baf7bc372c169088b0893f4e05bdf7377494" alt=""
生成模型
已知训练数据,从相同的分布中生成新的样本。
data:image/s3,"s3://crabby-images/f16f1/f16f150f33d290706b76c4e8d9746579147df643" alt=""
生成模型主要分为两类:一类是显式密度模型,另一类是隐式密度模型
1. PixelRNN and PixelCNN
显式密度模型:
data:image/s3,"s3://crabby-images/a8cee/a8ceec3595c7d261b1e8fb5c5d0ddf84455c10b8" alt=""
PixelRNN,从角开始生成像素,依赖于之前的像素,用RNN或LSTM建模的。如下,缺点为序列生成是很慢的。
data:image/s3,"s3://crabby-images/ebe4c/ebe4cb39b1272bdb19d202569a1ef69c98c61ee9" alt=""
PixelCNN,也是从角开始生成,依赖于之前的像素,用CNN建模的模型。如下,利用其周围的信息,输出是每个像素的softmax loss。与PixelRNN的训练速度一样,但是在生成的时候还是很慢。
data:image/s3,"s3://crabby-images/8c398/8c398dd8705298382c593aa5690174e87c210df1" alt=""
2. Variational Autoencoders (VAE)
Autoencoders是一个无监督学习的方法,可以对无标注的训练数据进行学习,学习低纬的特征表示。包含两部分,encoder是将输入映射到特征z,通常ecoder可以是一个线性层加非线性激活函数,也可以是一个全连接层,也可以是ReLU CNN。 特征z的维数通常比x小,因为降维操作。为什么需要降维呢?z应该代表x中的重要特征,并且这些特征可以用于reconstruct original data。decoder与encoder的组成相似,ReLU CNN(upconv),全连接,线性层加非线性激活函数。损失函数使用L2
data:image/s3,"s3://crabby-images/e26f2/e26f20ca2a5171118dbdf43ebb41e3b25487b76a" alt=""
问题:Intractability
data:image/s3,"s3://crabby-images/acc9a/acc9ac2fc7a78a190d807b7a195801af99695497" alt=""
data:image/s3,"s3://crabby-images/488d8/488d8b1ff93545da2a716f9167ec0497798e8674" alt=""
问题在于,对于每个z无法计算这个积分:
data:image/s3,"s3://crabby-images/ce205/ce205cc041a6dc9c99a579e9a06e8a1688452d22" alt=""
data:image/s3,"s3://crabby-images/97a03/97a03479958ebf8147410793a28a5288c6ee0b15" alt=""
解决方法:定义一个附加的encoder网络来近似p(z|x)。
data:image/s3,"s3://crabby-images/37a00/37a00196016216673f2e2f288d83ffb85e805f7a" alt=""
3. GAN
不是通过显式的密度方程来做生成,而是利用基于游戏理论的方法,通过2-player游戏来训练分布。包含生成器和判别器
data:image/s3,"s3://crabby-images/09a32/09a32771b1d2cd56ddff15cbe3dddce924552e41" alt=""
目标函数为:
data:image/s3,"s3://crabby-images/f5693/f5693d73a3fb3af9b7e09584e155ad04c98ef893" alt=""
三种方法的总结:
data:image/s3,"s3://crabby-images/e4d4c/e4d4c7fc88a2dbb6008758da0a1e937ef6f241e4" alt=""
网友评论