举个例子
假如我们有5000张手写数字图片,每一张图片有400个pixel,将整个数据集丢给一个4层结构的神经网络。
第2、3层为隐藏层,权重矩阵有和
设的维度为
设的维度为
我画了个图:
图中的圆形和方块均为激活单元,只是,方块表示与相乘的那个参数,一般情况下都设为1;这也是为什么401、26会出现的原因
在第三层,我们会得到这样一个矩阵,每一行就代表这每一个样本对应10个label的概率值,那么第四层只需要做一个softmax处理找到最大概率值对应的label是谁,即神经网络将此样本预测为哪个label!
网友评论