最终的判断是基于经验主义的:我们可以实验两种不同的网络设计,结果证明对于这个特定的问题而言, 10 个输出神经元的神经网络 比 4 个的识别效果更好。
从理解上,隐藏层的每个神经元用于检测图像的一个部分的特征,比如上部是弧形等,通过不同部位的识别和激活,最终得到这个数字是不是0.但是如果只有4个输出,那么就应该去判断数字的最高有效位是什么等细节。把数字的最高有效位和数字的形状联系起来并不是一个简单的问题。很难想象出有什么恰当的历史原因,10个数字的形状要素会和10个数字的最高有效位有什么紧密联系。当然我们可以通过在神经网络的十位输出之后再额外添加一层就可以实现按位表示数字的功能。
网友评论