研究背景:
肺部疾病是威胁现代人健康的重要疾病之一,如何使用快速且廉价的方法对肺病进行诊断是医学界的重要课题。
随着深度学习方法的兴起,世界各地越来越多的研究员在尝试用深度神经网络模型对医学图像进行分析、解释,获得可靠的诊断结果。
目前规模最大的肺部X光数据库ChestX-ray14 是由NIH研究院提供的,该数据库包含 14 种肺部疾病(肺不张、变实、浸润、气胸、水肿、肺气肿、纤维变性、积液、肺炎、胸膜增厚、心脏肥大、结节、肿块和疝气)的 10 多万张 X光前视图(约42G),研究人员对数据采用NLP方法对图像进行标注,1-14类分别对应14种肺部疾病,第15类表示未发现疾病。据称,该数据库标注准确率超过90%。
研究的意义:
在美国,肺癌每年导致22.5万人死亡,医疗保健费用占到了120亿美元.。早期发现对患者恢复和生存的最佳机会至关重要。
最新成果:
目前吕乐博士团队对这个数据库中的八种疾病图像进行研究,构建了ChestX-ray8数据集,借助ImageNet上的预训练模型对ChestX-ray8数据集进行多分类问题探索,研究成果详见:Wang_ChestX-ray8_Hospital-Scale_Chest_CVPR_2017_paper。
同时,吴恩达团队也在ChestX-ray14数据库的基础上进行肺炎诊断,其训练的CheXNet深度模型在肺炎诊断任务上的表现超过了人类,研究成果详见:CheXNet-Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning。
参考资料
本文将关于ChestX-ray14 数据库的公开资料(包括媒体报道,研究论文,数据库存储网站,社区讨论、开源代码和其他资料)整理如下,希望给从事相关工作的个人和组织提供帮助。
- 新智元报道:【3万患者11万图像14类病理】NIH公开大规模胸部X光数据集
- 雷锋网报道:吴恩达团队发布最新医学影像成果,用 CNN 算法识别肺炎
- 机器之心报道:吴恩达的最新研究是否严谨?Nature论文作者撰文质疑AI医疗影像研究现状
- Exploring the ChestXray14 dataset: problems
- CheXNet: an in-depth review
- NIH Clinical Center provides one of the largest publicly available chest x-ray datasets to scientific community
- 论文:Wang_ChestX-ray8_Hospital-Scale_Chest_CVPR_2017_paper
- 论文:ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases
- 论文:CheXNet-Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning
- 论文:Deep learning with non-medical training used for chest pathology identification
- Forum: predicting-pathologies-in-x-ray-images@kaggle
- Forum: Exploring the ChestXray14 dataset: problems
- 如何用深度学习进行CT影像肺结节探测
- ReferenceCode: Chest Xray image analysis using Deep learning ! @github
- ReferenceCode: brucechou1983/CheXNet-Keras This project is a tool to build CheXNet-like models, written in Keras@github
- ReferenceCode: arnoweng/CheXNet A pytorch reimplementation of CheXNet@github
- ReferenceCode: nih-chest-xray X-Net: Classifying Chest X-Rays Using Deep Learning@github
- ReferenceCode:NiftyNet@github
- ReferenceCode: yaoli/chest_xray_14@github
- ReferenceCode: Diagnose Lung Disease with VGG16@kaggle
- ReferenceCode: Predicting Pathologies In X-Ray Images@kaggle
网友评论