2021的开篇完成了自己一个自然语言整合的产品,发现除了说以外,的确是实践出真知。

而随着个人技术大门的打开,意味着自己不仅仅有想法,而且可以在自己的能力下去完成一定的实现工作,的确是一件非常美妙的事情!
而随着能够让计算机看懂文字,又触及到让计算机“看见世界”,这时候发现机器学习、深度学习,对自己不再是一些概念上面的科学术语,而是能够像人脸识别一样,已经切切实实融入到生活中。
讲到计算机的图像识别能力,不得不将到卷积神经网络。
一、什么是卷积神经网络
卷积神经网络 – CNN 最擅长的就是图片的处理。它受到人类视觉神经系统的启发。目前 CNN 已经得到了广泛的应用,比如:人脸识别、自动驾驶、美图秀秀、安防等很多领域。
CNN 有2大特点:
- 能够有效的将大数据量的图片降维成小数据量
- 能够有效的保留图片特征,符合图片处理的原则
二、CNN如何解决问题
1、图像处理难点
图像是由像素构成的,每个像素又是由颜色构成的。

2、CNN如何解决
人类的视觉原理如下:从原始信号摄入开始(瞳孔摄入像素 Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定,眼前的物体的形状,是圆形的),然后进一步抽象(大脑进一步判定该物体是只气球)。下面是人脑进行人脸识别的一个示例:

我们可以看到,在最底层特征基本上是类似的,就是各种边缘,越往上,越能提取出此类物体的一些特征(轮子、眼睛、躯干等),到最上层,不同的高级特征最终组合成相应的图像,从而能够让人类准确的区分不同的物体。
那么我们可以很自然的想到:可以不可以模仿人类大脑的这个特点,构造多层的神经网络,较低层的识别初级的图像特征,若干底层特征组成更上一层特征,最终通过多个层级的组合,最终在顶层做出分类。
网友评论