卷积神经网络工作原理研究 - 概要

作者: b19707134332 | 来源:发表于2017-04-07 14:46 被阅读422次

卷积神经网络工作原理研究 - 概要
CNN
卷积
机器学习相关
卷积神经网络工作原理研究 - Inception结构研究
卷积神经网络工作原理研究 - 总体提纲
【连载】深度学习笔记11：利用numpy搭建一个卷积神经网络
卷积神经网络工作原理研究 - 语义和特征
CS231n 卷积神经网络: 架构, 卷积/池化层(上)
cnn学习资料

卷积神经网络在图像识别领域无限风光，通过一张图片，算法可以知道图片上的物体是什么，着实令人震惊，但是很多人和我一样，对于其背后的原理，都非常好奇，卷积神经网络是如何进行图像识别的呢？

图像识别

如果你的英文主够好的话，可以阅读这篇论文：
Visualizing and Understanding Convolutional Networks

猫应该长成什么样子

看过女神李飞飞的ImageNet演讲的人，都对于下面两张图片印象深刻。
原文请阅读：
ImageNet缔造者：让冰冷的机器读懂照片背后的故事

（从薛定谔开始，猫就一直被各种科学家拿出来说事情，当然汪星人也时不时出镜）

人类是如何识别猫咪的？借用知乎的一个回答：

现在假设要做一个图像的分类问题，比如辨别一个图像里是否有一只猫，我们可以先判断是否有猫的头，猫的尾巴，猫的身子等等，如果这些特征都具备，那么我就判定这应该是一只猫。当然，如果图像是下面这样一只老实本分的猫咪，则一切都好办了。

正常的猫

但是喵星人不但品种不同，颜色繁多，各种销魂的动作也层出不穷，所以，机器识别猫还是很困难的。

扭曲的猫

这样，我们必须要让机器知道，猫，到底应该长成什么样子。

想象中的图形识别原理

第一次考虑怎么处理这个问题，一个很自然的想法浮想在脑海里面：
将所有猫咪的图片放在一起，提取出猫咪的共同特征，做成一个识别猫的模型。然后对于每张图片，使用模型，看一下是猫的概率为多少。但是如果真的这样做的话，可能每种物体都必须要有一个专门的模型了，这样可能是不行的，计算量可能也是一个问题。特别对于扭曲的猫，这样子的例子非常难处理，我们不太可能穷举出所有猫的正常和非正常形态。（毛色，眼神，是否有物体和猫进行交互）

当然，可以考虑，将猫进行分解，就如知乎网友所说，猫头，猫尾巴，猫爪子，独立进行识别。这样不管猫怎么扭曲，都无所谓了。当然，如果你是资深猫奴，你可以很高兴的说出猫的组成特征，但是，这样本质上还是加入了太多的领域专家的干涉。如果要识别大型粒子加速器，这个是不是要请物理学家参与呢？所以，机器应该完全屏蔽领域知识才可以做到泛用。