LIDC XML文件说明文档
版本1.0
2006.1.11
以下为2009.1.15添加的注释
请注意,我们最近(2008年秋季)发现一个病例的子集在候选结节被识别为>3mm的刺孔和分叶特征时,其中有5个位置使用了不一致的评级系统。某些情况下的结节特征数据将受此错误的影响。对于由此带来的任何不便,我们深表歉意,我们正在纠正这种情况。
<p style="text-align: right;">LIDC team 2009.1</p>
0. 索引:
- 概述
- LIDC数据的收集过程
- 选择标准
- 通信协议
- 标记对象的类别
- XML数据文件的格式和内容
- 带注释的示例XML文件
1. 概述
本文档为XML文件,其详细描述了LIDC数据收集过程以及医师对标记结果的注释。本文将首先给出医师对LIDC的标记过程(盲读和非盲读取过程)的一些背景知识,以便正确地解释XML文件中的数据。接下来,我们将描述XML文件本身的格式和内容。最后将提供DICOM图像,XML文件和使用两者的示例情况。
在不久的将来,将向提供由LIDC或数据库用户已经向LIDC授权的工具/代码或计算机软件代码链接。
2. LIDC数据收集过程
LIDC在严格指定的收录标准、选择标准和标记协议下收集数据。关于LIDC,其使命和其若干内部报告的补充背景知识可以在此链接或通过以下出版物获取。
Armato SG 3rd, McLennan G, McNitt-Gray MF, Meyer CR, Yankelevitz D, Aberle DR, Henschke CI, Hoffman EA, Kazerooni EA, MacMahon H, Reeves AP, Croft BY, Clarke LP;
Lung Image Database Consortium Research Group. Lung image database consortium: developing a resource for the medical imaging research community. Radiology. 2004 Sep;232(3):739-48.
其收录标准,选择标准和标记协议如下所述。
3. 选择标准
3.1 病例的纳入标准
根据纳入标准,提名病例应包括以下内容:
ⅰ. 仅肺部的CT扫描 - 没有其他模态或解剖区域包括在此数据库(胸部X射线将包括在未来的版本);
ⅱ. 全胸部检查或诊断性CT检查或有限的解剖学诊断性CT检查;
ⅲ. 重建间隔和准直都 < 3mm;
ⅳ. 扫描可能包括很高的噪声或条纹,运动或金属伪影(这将在图像质量的评估中表征);
ⅴ. 可能存在其他病理,除非它与结节在空间上邻接并且基本上干扰其视觉解释。
3.2 结节的入选标准
被提名病例可能有0至6个结节,其中:
ⅰ. 术语“结节”表示影像上异常的光谱(不考虑特定的组织),它被称为“局部异常”,是更广泛的异常谱的子集;如果符合“结节”的定义,则病变应被认为是“结节”(其定义最重要的组成部分是“结节”的形态--其余组分将由结节视觉库确定);
ⅱ. 最大直径在3-30mm之间的结节数目不应该超过6(至少在病人最初提供的扫描上是这样);
ⅲ. 结节可以代表原发性肺癌,转移性瘤或非癌性过程。
4. 阅片协议
LIDC阅片过程有两个阶段。在第一阶段,N个读者(2006年1月时 N = 4),独立地盲读和注释每种病例。也就是说,他们都读同样的情况,但他们是异步和独立完成的。阶段一有了结果之后,盲读完成,它们被编译并发送回同一个读者,以便他们可以看到自己的标记以及其他三个读者的标记。然后每个读者再次独立地阅读每个案例,此阶段有个好处就是可以看到其他读者标记的信息,然后对该案例的标记做出最终决定。
5. 标记对象的类别
经仔细考虑后决定让医师标记三类物品。这些类别是既符合基于对象大小和又满足LIDC结节入选标准的那些对象以及不符合结节标准但可能与结节混淆的对象。最后一类(下面描述的非结节)是通过明确标记不代表潜在癌症的对象,以此来帮助CAD开发人员。请注意,物体尺寸由电子测径器确定,以估计损伤最大程度的截面中的病灶最长直径,在损伤尺寸中不考虑损伤的轴向范围。
因此,产生的类别是:
5.1 3mm < 结节直径 < 30mm
ⅰ. 对于这些结节,每个医师在其出现的所有切片中围绕结节绘制完整的轮廓,其中构成轮廓的像素在结节外部的第一个像素;
ⅱ. 通过构建另一个轮廓消除了结节内的“排除区域”,再次使用构成排除轮廓的像素作为排除区域的一部分(师兄,我描述得不太直观,你可以想想圆环,环内就是排除区域);
ⅲ. 最后,要求每位读者主观评估结节的几个特征(1-5级的每个特征):
①微小性 - 体现在其检测的困难度;
②内部结构 - 结节内部组成的预测(软组织,液体,脂肪,空气);
③钙化 - 钙化程度(如果存在);
④球形度 - 结节的三维形状,球形度定义为与结节相同体积的球体的表面积和结节的表面积之比。球的球形度等于1,其它凸体球形度小于1;
⑤边距 - 描述结节的边界有多明确;
⑥针刺 - 根据现有结节的推测量;
⑦纹理 - 内部纹理或根据孤立结节和磨砂玻璃结节组成;
⑧良恶性 - 放射科主观评估这个结节恶性肿瘤的可能性,例如60岁男性吸烟者;
5.2 结节直径 < 3mm
仅给出这种不确定性结节的近似三维质心(注意:不提供轮廓)。默认为结节,但是如果影像学表现的不透明度显然是良性的,则无标记且无主观评价的特征。
5.3 直径 > 3mm 的非结节
仅给出这种不确定性结节的近似三维质心(注意:不提供轮廓)。无主观的特征评价,给出其近似三维质心或在关键点的突出焦点上有标记的“非结节连接”区域(注意:数据库没有区分5.2和5.3);默认为非结节,非结节关节内的结节可以根据单独指示。超过30 mm的应标记为“直径 > 3mm 的非结节”
注意:非结节<3 mm未标记。
6. XML数据文件的格式和内容
LUNA16数据集不包含XML文件,这里先不翻译
7. 带注释的示例XML文件
LUNA16数据集不包含XML文件,这里先不翻译
网友评论