DenseNet的tensorflow实现

作者: leotmc | 来源:发表于2019-03-02 16:53 被阅读6次

    这篇博文主要由以下三部分组成
    1. DenseNet和ResNet的对比
    ResNet的出现,使我们能够训练数更深的网络,ResNet的核心是通过采用Skip-Connection的方式(如图1所示),使我们在训练非常深的网络的时候也不会出现梯度消失的现象。

    图1 ResNet中的skip connection

    与ResNet相比,DenseNet采用了一种更为密集的连接方式,即Dense Connection,两者的连接方式对比如图2所示。

    图2a ResNet中的连接方式 图2b DenseNet中的连接方式

    对比一下,我们会发现,两者的不同在于ResNet是采用的Element-wise addition,DenseNet中采用的是Channel-wise concatenation。
    在Resnet中
    x_{l}=H_{l}(x_{l-1})+x_{l-1}
    其中x_{l-1}表示第l-1层的输出,x_{l}为第l层的输出,H函数可以看成是卷积层,激活层,池化层的抽象表示。
    在DenseNet中
    x_{l}=H_{l}([x_{0},x_{1},...,x_{l-1}])
    其中[x_{0},x_{1},...,x_{l-1}]0,...,l-1层的特征的concatenation。
    DenseNet通过采用这种密集的连接方式,可以更好的利用每一层的特征,因此DenseNet可以用更少的层达到比ResNet更好的效果。

    2. DenseNet的网络结构
    由于所选用的层数不同,网络的结构也会有所不同,这里我们对40层的DenseNet的网络结构作一定的说明,40层的DenseNet中有3个dense block和2个transition layer。
    DenseNet的网络结构主要由两部分组成,这两部分分别为dense block和transition layer,如图3所示。

    图3 DenseNet的网络结构

    dense block: 在40层的DenseNet中,每个dense block中有12层,每一层由BN-RELU-CONV组成,由于dense block中采用concatenation的连接方式,因此要保证每一层的feature map的size一样,所以在每一层的CONV中采用3\times 3卷积和1的padding来保证经过卷机的处理后feature map的size保持不变。
    transition layer: transition layer用来连接前后的两个dense block,由于DenseNet中采用的是concatenation的连接方式,因此经过dense block后,feature map的数量会非常多,在transition layer中采用1\times1的卷积来降低feature map的数量,transition layer中还包含有2\times2的pooling。

    3. 代码
    dense block的代码:

        def dense_block(self, p):
            for i in range(self.num_layers_in_dense_block):
                with tf.variable_scope('bottle_neck{0}'.format(i)):
                    x = tf.layers.batch_normalization(p)
                    x = tf.nn.relu(x)
                    x = tf.layers.conv2d(inputs=x, filters=self.growth_rate, kernel_size=3, strides=1, padding='same', kernel_initializer=tf.random_normal_initializer(stddev=0.01))
                    x = tf.concat([x, p], axis=3)
                    p = x
            return x
    

    transition layer的代码:

        def transition_layer(self, x):
            x = tf.layers.batch_normalization(x)
            x = tf.nn.relu(x)
            n_inchannels = x.get_shape().as_list()[3]
            n_outchannels = int(n_inchannels * self.compression)
            x = tf.layers.conv2d(inputs=x, filters=n_outchannels, kernel_size=1, strides=1, padding='same', kernel_initializer=tf.random_normal_initializer(stddev=0.01))
            x = tf.layers.average_pooling2d(inputs=x, pool_size=2, strides=2)
            return x
    

    完整代码见github,采用的数据集为cifar-10

    参考文献:

    1. DenseNet
    2. ResNet
    3. DenseNet:比ResNet更优的CNN模型

    相关文章

      网友评论

        本文标题:DenseNet的tensorflow实现

        本文链接:https://www.haomeiwen.com/subject/tineuqtx.html