04 从大脑识别到ConvNets识别
大脑识别模式:当人的眼睛聚焦于一个场景时,眼睛接收到的是由场景中的物体发出或其表面反射的不同波长的光,这些光线激活了视网膜上的细胞,本质上说是激活了眼睛后面的一个神经元网格。这些神经元通过位于眼睛后面的纤长的视觉神经来交流彼此的激活信息并将其传入大脑,最终激活位于大脑后部视皮层的神经元。视皮层大致是由一系列按层排列的神经元组成,就像婚礼蛋糕那样一层一层堆在一起,每一层的神经元都将其激活信息传递给下一层的神经元。
ConvNets识别模式:ConvNets由一系列模拟神经元层组成,在这里,我还是将这些模拟神经元称为单元。每层中的单元为下一层的单元提供输入,当一个ConvNets处理一张图像时,每个单元都有一个特定的激活值——根据单元的输入及其连接权重计算所得的真实的数值。ConvNets的输入是一幅图像,即与图像每个像素的颜色和亮度一一对应的一个数值组。它的最终输出是网络对于每种类别(狗或猫)的置信度(0~100%)。我们的目标是让网络学会对输入图像所属的正确类别输出高置信度,对其他类别输出低置信度。这样,网络将了解输入图像的哪些特征对完成这项任务最有帮助。
网友评论