科研:
一、GAN 对抗网络简介
在我理解来,GAN主要的用处是解决数据集不够的问题。通过输入一个噪声,并研究现有真实数据集的分布,来创造一个假的数据集(但是这个假的数据集和真的相比,判定网络无法发现区别)。
不要怂,就是GAN!(这篇文章分析了几篇GAN的论文)
二、representation learning(表征学习、特征学习)
以下摘自维基百科
在机器学习中,特征学习或表征学习[1]是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。
机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。
特征学习可以被分为两类:监督的和无监督的,类似于机器学习。
在监督特征学习中,被标记过的数据被当做特征用来学习。例如神经网络,多层感知器,(监督)字典学习。
在无监督特征学习中,未被标记过的数据被当做特征用来学习。例如(无监督)字典学习,独立成分分析,自动编码,矩阵分解[2],各种聚类分析及其变形[3][4][5]。
网友评论