个人感想
整个深度计算的流程,概括的来说。就是
定义随机点(参数) --> 计算损失 --> 计算梯度--> 更新点(参数): 追求损失函数到满意值的一个过程
而层相关的概念,主要是为了简化计算。具体可以见第五章计算图的说法。而简化计算。主要是两个方面。
- 简化正向计算,使得计算能够比较方面的理解,一个层可以抽象为一种计算。而整个AI的推演过程中,这样使得人能够理解
- 简化反向计算,也就是计算梯度,这样可以方便的进行一些更新参数
参数和超参的差异要了解。
笔记
第六章阅读笔记
看到这里,觉得这本书主要讲了几点。
第一,什么深度学习,深度学习有多少相关的元素。
第二,就是元素怎么优化。
没有将具体怎么设计或者说编排这些元素。
激活函数(第三章)
损失函数的比较方法(第四章)
参数调试方式(五章)
一些杂项。权重,Normalization,防止过拟合,还有超参的调整(第六章)
第七章
关于卷积层
这里的卷积层,就好像中间有个镂空的方格,把背景看一遍。然后每看一次的这个镂空的地方看的东西,获得一个snapshot。报告
这个卷积层就好像是一个滤镜,或者说特征。然后分析的是他的报告的感觉。
关于im2col函数
这个函数,做的就是为了方便计算而做了一个转换。
卷积计算,其实是吧滤波器在原始数据上面一块一块的扫过去(做卷积计算)。
而这个,就是把一块一块变成一行数据。然后滤波器也是做一样的事情。最后,就是2维数据和2维数据之间做的计算。
就是为了方便一点。
其实这里我完全看不懂。这个im2col是怎么干的。就是知道他要把一个高纬度的东西拍平。
其实这里关键还是要有线性代数的知识。脑子里面一片混乱啊。
网友评论