卷积神经网络

作者: zidea | 来源:发表于2020-08-16 21:55 被阅读0次
    MachineLearninginMarketing

    纹理

    <img src="images/pattern_001.jpg">
    我们要识别图片的内容,读取图片的信息,我们不但提取出图片中一些边缘的信息还需要识别出图案中纹理,这样我们才能准确获取图片的信息。

    纹理表示方法

    纹理是由一些基元按照一定形式组合而成,所谓纹理基元就是在图片中重复出现的最小单元的图案。

    • 规则纹理
      <img src="images/tile_pattern.jpg">
    • 随机纹理
      <img src="images/beer_pattern.jpeg">
    基于卷积核组的纹理表示方法

    有关图片纹理我们还可以引入一些统计学的概念,也就是不但通过基元,而且通过统计学信息描述这些基元如何组合在一起。

    • 利用卷积核组提取图像中的纹理基
    • 利用基元的统计信息来表示图像的纹理
    卷积核组

    <img src="images/kernel_group.png">
    我们把这样 7 卷积核放在一起就是卷积核组,我们现在第一个卷积核看起,这个卷积核应该是高斯偏导核,用于检测水平的边,前 6 卷积核是用于检测不同方向的边,而最后一个用于检测图片上是否有圆形图案。

    <img src="images/kernel_detect_circle.png">
    <img src="images/kernel_detect_hline.png">

    基于卷积核组的图像表示
    • 设计卷积核组
    • 利用卷积核组对图像进行卷积操作获取对应的特征响应图组
    • 利用特征响应图的某种统计信息来表示图像中的纹理
      <img src="images/kernel_grp_presentation.png">

    那么我们是如何用卷积核提取图案信息来表示图像呢,首先我们用卷积核组每一个卷积核去扫描图片得到对应响应图,卷积核下方对应的图,然后将这个响应图用一个向量来表示,也就是将图片矩阵展平,如100 \times 100大小的响应图展平就是 10000 维的向量(r_{11}),然后在将这些向量组合就得到基于卷积核组的图像表示。

    r_1 = \left[ r_{11}, r_{12},\cdots,r_{1\times n} \right]

    • r_1 表示第一个特征图展开的向量
    • r_{1\times n} 表示第 1 个特征图上第 n 个位置的响应值

    纹理分类任务

    接下来介绍一种更简单表示方式,因为基元位置与分类关系不大,也就是对分类没有什么影响。所以我们在用纹理表示图片没有必要记录位置信息。

    • 基元位置无关
    • 关注出现了哪种基元对应的纹理以及基元出现的频率
      好基于上面内容,我们可以用每一个响应图所有值平均值的组合来表示图像
      <img src="images/kernel_grp_presentation_2.png">

    \overline{r_i}i个特征响应图的均值

    卷积核组设计

    每一个卷积核描述一种结构。

    • 卷积核类型(边缘、条形以及点状)
    • 卷积核尺度(3-6个尺度)
    • 卷积核方向(6个角度)

    相关文章

      网友评论

        本文标题:卷积神经网络

        本文链接:https://www.haomeiwen.com/subject/ppjxjktx.html