论文地址:https://ieeexplore.ieee.org/document/7785132
V-Net 是另一种版本的3D U-Net。它与U-Net的区别在于: 1、3D图像分割end2ent模型(基于3D卷积),用于MRI前列腺容积医学图像分割。2、新的目标函数,基于Dice coefficient。3、数据扩充方法:random non-linear transformations和histogram matching(直方图匹配)。4、加入残差学习提升收敛。
(1)网络结构
其网络结构主要特点是3D卷积,引入残差模块和U-Net的框架,网络结构如图:
V-Net网络结构
整个网络分为压缩路径和非压缩路径,也就是缩小和扩大feature maps,每个stage将特征缩小一半,也就是128-128-64-32-16-8,通道上为1-16-32-64-128-256。每个stage加入残差学习以加速收敛。
图中的圆圈加交叉代表卷积核为5*5*5,stride为1的卷积,可知padding为2*2*2就可以保持特征大小不变。每个stage的末尾使用卷积核为2*2*2,stride为2的卷积,特征大小减小一半(把2x2 max-pooling替换成了2x2 conv.)。整个网络都是使用keiming等人提出的PReLU非线性单元。网络末尾加一个1*1*1的卷积,处理成与输入一样大小的数据,然后接一个softmax。
(2)损失函数
由于前景比较小,在学习过程中不容易被学习到,因此重新定义了Dice coefficient损失函数。两个二进制的矩阵的dice相似系数为:
Pi为预测的前景,Gi为标记的前景
使用这个函数能避免类别不平衡。
网友评论