论文学习2“Deep Feature Learning for

作者: Carrie_Hou | 来源:发表于2017-12-13 20:19 被阅读21次

    文章题为:用于肺部CT肺结节分类的深度特征学习,文章发表于2016年IEEE Xplore,作者来自于韩国大学。本文的核心思想是将深度学习出来的特征和原始图像形态特征整合到一个长的特征矢量中,用这个长特征矢量做分类。

    背景

    在世界上,肺癌的死亡率非常高,但如果能在早期发现肺癌的迹象,我们可以通过治疗解决,而早期诊断就是CT检测里肺结节大小的问题,大于3mm的肺结节就有可能产生癌变。而在医学资源缺乏,AI技术蓬勃发展的现在,计算机进行肺结节检测就十分重要。目前已有用CNN等方法进行的检测,但大都忽略了肺结节尺寸、形状等形态信息。本文提出结合形态特征的方法进行检测。具体内容如下。

    方法

    1)数据集和形态特征,选择20个病人由经验丰富的医生手工切割,有178个恶性和3420个良性结节从每个结节我们提取了96个形态特征,如下表所示:

    2)学习高度相关信息,本文采用SDAE(堆栈去噪自编码器)来学习潜在的形态特征之间的非线性相关,具体来说,首先在SDAE结构上多加一个label层,通过非监督的方式预训练参数值作为初始值来训练深度神经网络。然后通过一个监督方式微调所有的参数。在训练SDAE之后,去除最后的隐藏层的输出,即SDAE label的输入,作为和固有的原始形态特征高度相关的值。最后将原始形态特征和SDAE学习到的特征通过一个长矢量联系在一起,作为我们新的增强特征矢量。

    SDAE是去噪自编码器DAE堆栈到一起的结构。DAE是指能够对 “被污染/破坏” 的原始数据进行恢复的一种自编码器,结构如下:

    DAE就是以一定概率分布(通常使用二项分布)去擦除原始input矩阵,即每个值都随机置0,再将擦除过的输入矩阵按照AE的模型训练,这种方法可以去除部分噪声,并有比较好的鲁棒性。

    而SDAE就是将DAE的输出层去掉,直接将隐层作为下一个DAE的输入,堆栈自编码器也是为深度学习打下了基础。

    3)特征选择和分类器训练,本文通过特征和种类标签之间的统计学测试进行特征选择,具体是对每个特征分别进行了一个简单的t-test,当测试的p-value大于预设门槛,认为对应的特征没有提供对分类有用的信息,对于被选择的特征,选择了一个线性的SVM进行分类。

    实验

    本文设计了一个5层的SDAE,三个隐层神经元的数目分别是300,200,100。预训练时选择所有样本以保证更好的利用DAE。性能评估时,为了保证良、恶性肿瘤平衡,本文选择了200个良性肿瘤样本和178个恶性肿瘤样本进行5-fold交叉验证。

    微调SDAE之后,通过联合最后隐藏层的输出即100个值和原始96维特征得到了一个196维的增强特征矢量,p-value的门槛设置为0.001,利用SVM进行五倍交叉嵌套验证。我们用准确性,敏感性,特异性和接受者操作特意曲线下的区域(AUC)进行评测,结果如下:

    Original+SDAE特征在每个性能表现都更优异。特别是准确性和敏感性分别提高了2.1%和3.4%。结果说明CT肺结节检测中的形态信息对于图像分割还是很有用的。

    相关文章

      网友评论

        本文标题:论文学习2“Deep Feature Learning for

        本文链接:https://www.haomeiwen.com/subject/aaizixtx.html