文章指路:https://doi.org/10.1007/s00330-019-06533-w
摘要
摘要目的:
本文主要目的是应用AI来预测CT表现为磨玻璃结节的肺腺癌。
也将结果与放射科医生的判断进行了对比来判断模型的表现。
方法学研究
数据集建立
本次研究纳入从两个中心组织病理学确认的828例磨玻璃结节。
所有磨玻璃结节都满足以下纳入条件条件:
- 手术切除后进行了病理切片确认
- 所有结节都是一阶段的非小细胞肺癌(stage I NSCLC)
- 结节最大径在3mm到30mm之间
对于每一个病人有以下条件: - 有明确胸外肿瘤手术后的病理报告
- CT图像为横切面图像,并且图像表现为磨玻璃结节
- 选择术前最新的一次CT影像资料
828个结节中,来自上海肺科医院的102个结节被用来制作测试集,来自复旦大学肿瘤医院的726个结节被用于制作训练集
病人基线
预处理
将CT图像-1000HU~400HU的分辨率,转到RGB图像的0-255的分辨率下,并且转成8-bit的灰度图。由影像科医生确定结节中心位置,然后以结节中心位置重建出64×64×64空间内结节的三视图。三视图被合成到RGB图像的三条通道中,最后使用了data arguement来扩充数据容量:(因为IA数量较少,所以用data arguement来平衡训练集)
- 高斯噪声
- 旋转图像
- 上下或左右颠倒
- 伽马校正
- 中心旋转
神经网络模型
使用模型改自ResNet,optimize = RMSprop,loss = CrossEntropy,lr = 0.001,iteration = 5000,batch_size = 24
代码:https://github.com/GongJingUSST/ResidualLearningCNN
(那天我也可以po自己的代码就好了哭哭)
效果衡量
找两个放射科医生进行了一个observer study。两个医生看片子,5分钟之内给出自己关于是否是IA的判断,关于实质性成分以及是否是IA的判断分为五个等级见下表
影像科医生判断分级
衡量指标主要是ROC那一系列,ACC、F1等。
结果
下图显示的是影像科医生和两个模型的结果
结果比较
下图显示了两个影像科医生判断的实质性组织量的分布
实质性分布
ROC比较
ROC
讨论部分
董劳斯意思写的水平不是很高,总结一下亮点吧:
- 建立了带有病理数据的数据集
- 让和两个影像学医生进行了对比
- 用残差网络避免了梯度下降
局限:
- 数据集数据集还是不足,导致过拟合
- 对于信息系利用局限于64*64的图像内,不像影像科医生可以利用整个图片的信息,以及病人信息,历史数据啥的
- 影像科医生的读图有时间限制,和真实的临床情况不一样
- 对于模型的不够的解读(?)
网友评论