美文网首页
AlexNet拆解分析

AlexNet拆解分析

作者: CrazyCat_007 | 来源:发表于2018-11-19 23:27 被阅读0次

学习深度学习后接触的第一个复杂的神经网络就是AlexNet,刚开始看到它时还是比较晕菜的,因为是自学,感觉看过去就算了,但自己又有种钻牛角尖的精神,回过头来一遍一遍地分析AlexNet,推算每一步的由来,经过多方资料的整合和验算,终于得出了自己较为满意的理解。

首先,看一下整体的网络结构图:

AlexNet神经网络结构图

图中可以看出,整个过程共分为8层,而每一个步骤又不尽相同,共分为5个卷积层,3个全连接层(注:全连接层后不能再加卷积层和池化层)。其中,在第1,2,5层使用了Max pooling,且1,2层还使用了LRN操作;第6,7,8层使用了dense操作,且6,7层使用了dropout全连接操作。接下来,简单介绍下AlexNet网络中存在的一些知识点。

•Relu激活函数:AlexNet首次使用了Relu激活函数,表达式为max(0,x),即x为负数时,结果为0。

•2-GPU并行结构:该网络使用了两个GPU,使运算速度能够得到有效提升。

•Max pooling:池化层有最大值池化、平均值池化,这里使用的是最大池化层,用来减少计算量,一定程度解决平移鲁棒。

•dropout全连接层:将某一层50%的神经元的随机置为0,为了降低过拟合。

•LRN:局部响应归一化分为通道间归一化和通道内归一化,这里使用通道间归一化。

接下来就是对AlexNet进行拆解分析了。

第1层

第一层输入为227*227*3大小的图片(多方证实227为正确的输入尺寸大小,且便于后续计算),使用96个11*11*3的卷积核进行卷积后得到55*55*96个像素层(注55的由来:(227-11)/4+1=55),由于系统使用了双GPU,因此分为两组55*55*48的像素层。由于第二层的输入尺寸为27*27*128,因此这里的max pooling池化层使用了规模为3*3,步长为2进行处理,池化后的像素层即在每一个GPU上生成了27*27*48的像素层(注27的由来:(55-3)/2+1=27)。最后,在5个通道数的相邻通道间进行LRN局部归一化处理,最终得到两组27*27*48的像素层。

第一层的参数共为11*11*3*96+96=34944个。

第二层

第二层中,在每一个GPU上输入的尺寸为27*27*48,使用128个5*5*48的卷积核进行卷积操作,得出27*27*128的像素层(注27的由来:(27-5+2*2)/1+1=27,其中2*2为padding操作,其实主要是为了便于后续计算方便,有种“拼凑”的感觉)。由于第三层的输入尺寸为13*13*192,因此max pooling池化层使用了规模为3*3,步长为2进行处理,池化后的像素层即在每一个GPU上生成了13*13*128的像素层(注6的由来:(27-3)/2+1=13)。最后,在5个通道数的相邻通道间进行LRN局部归一化处理,最终得到两组13*13*128的像素层。

第二层的参数共为(5*5*48*128+128)*2=307456个。

第三层

第三层中,由图中可以看到虚线的指向和前面不同,这里可以理解为将两个GPU的像素层合并后进行卷积,之后再重新分为两组,这样有利于样本的随机性。因此结合两组GPU输入的尺寸为13*13*256,使用384个3*3*256的卷积核进行卷积操作,得出13*13*384的像素层(注13的由来:(13-3+2*1)/1+1=13,其中2*1为padding操作,这里仍然是为了便于后续计算方便,有种“拼凑”的感觉)。第三层只是简单的卷积操作,因此最终得到两组13*13*192的像素层。

第三层的参数共为3*3*256*384+384=885120个。

第四层

第四层更为简单,在每一个GPU上输入的尺寸为13*13*192,使用192个3*3*192的卷积核进行卷积,最终得到两组13*13*192的像素层(注13的由来:(13-3+2*1)/1+1=13,原因同上)。

第四层的参数共为(3*3*192*192+192)*2=663936个。

第五层

第五层中,在每一个GPU上的输入尺寸为13*13*192,使用128个3*3*192的卷积核进行卷积后得到13*13*128的像素层(注13的由来:(13-3+2*1)/1+1=13,原因同上)。然后同样使用规模为3*3,步长为2的max pooling池化层,池化后的像素层即在每一个GPU上生成了6*6*128的像素层(注6的由来:(13-3)/2+1=6)。最终得到两组6*6*128的像素层。

第五层的参数共为(3*3*192*128+128)*2=442624个。

第六层

第六层由图中可见,这里同样将两个GPU的像素层合并后进行全连接,之后再重新分为两组,因此结合两组GPU输入的尺寸为6*6*256,由于这里是dropout全连接层,因此使用了4096个神经元进行输出,且该过程中了使用Relu激活函数,降低了过拟合,提高了计算速度和准确度。最终得到4096个输出。

第六层的参数共为6*6*256*4096+4096=37752832个。

第七层

第七层同第六层类似,即将两个GPU的像素层合并后进行全连接,之后再重新分为两组,同样这里是dropout全连接层,使用了4096个神经元进行输出,且该过程中了使用Relu激活函数,降低了过拟合,提高了计算速度和准确度。最终得到4096个输出。

第七层的参数共为1*1*4096*4096+4096=16781312个。

第八层

终于到达最后一层了。在第八层中,对4096个输入使用1000个神经元进行全连接输出,最终得到1000个输出。

第八层的参数共为1*1*4096*1000+1000=4097000个。

总结:AlexNet神经网络共经历了8层包括卷积、池化、全连接操作,总参数有60965224个,其中参数量多在全连接层。我对AlexNet神经网络的研究在深度学习领域只是一个开始,研究生期间一直在研究聚类算法,结合过简单的如Hopfield等神经网络并取得了一定的效果,毕业后进入工作,业余时间用来自学深度学习,发现自己对人工智能方面的认识只是九牛一毛,很快被其强大及神秘深深地吸引。第一次在简书上写文章,有不足之处还望大家多多包涵,指出问题共同探讨。

相关文章

  • AlexNet拆解分析

    学习深度学习后接触的第一个复杂的神经网络就是AlexNet,刚开始看到它时还是比较晕菜的,因为是自学,感觉看过去就...

  • 9种常用的数据分析方法

    公式拆解、对比分析、A/Btest、象限分析、帕累托分析、漏斗分析、路径分析、留存分析、聚类分析 一、公式拆解 所...

  • Pytorch实现AlexNet解决自定义数据集(cifar10

    AlexNet 代码地址 Why AlexNet very good? 为什么Alexnet能在图2012 Ima...

  • 产品分析如何选题

    产品分析报告包括拆解产品、市场分析、用户分析、功能分析、运营分析; 1.最核心的模块——功能分析 拆解产品,从市场...

  • 【技术博客】基于AlexNet网络的垃圾分类

    【技术博客】基于AlexNet网络的垃圾分类 AlexNet AlexNet模型来源于论文-ImageNet Cl...

  • AlexNet模型分析与实现

    卷首语:对于上次详谈CNN的文章,我看到很多负面评论。哎呀我滴个小心脏,不甘心的我也请了我的老友(软件工程专业)作...

  • CNN之——AlexNet

    深度卷积神经网络(AlexNet) AlexNet⾸次证明了学习到的特征可以超越⼿⼯设计的特征 AlexNet与L...

  • 2020 经典卷积神经网 AlexNet

    AlexNet 虽然 AlexNet 今天人们不会在采用或借鉴 AlexNet 来设计网络来,不过无疑是 Alex...

  • CNN经典模型总结

    LeNet-5 AlexNet VGG ResNet GoogLeNet Ng推荐论文阅读顺序:AlexNet——...

  • Conv_structure

    0.Alexnet Alexnet知乎讲解文章_paper 0.Network in Network Networ...

网友评论

      本文标题:AlexNet拆解分析

      本文链接:https://www.haomeiwen.com/subject/cyfzfqtx.html