
背景:在临床活检中区分导管原位癌(DCIS)和浸润性导管癌(IDC)区域对诊断是一个挑战。空间转录组学(ST)是一种原位捕获方法,可以定量和可视化单个组织切片中的转录组。在过去,研究已经表明,乳腺癌样本可以用于研究其转录组在单个组织切片的空间分辨率。以前,监督机器学习方法被用于临床研究预测癌症类型的临床结果。
方法:我们使用了四个公开的ST乳腺癌数据集,这些数据来自被病理学家标注为非恶性、DCIS或IDC的乳腺组织切片。我们训练和测试了一种机器学习方法(支持向量机),该方法基于专家注释以及根据其转录组图谱自动选择细胞类型。
结果:我们识别了专家标注区域(非恶性、DCIS和IDC)的表达签名,并建立了机器学习模型。798份表达签名转录本的分类结果与DCIS(100%)和IDC(96%)的专家病理学家注释符合率较高。将我们的分析扩展到所有25179个表达的转录本,结果DCIS的准确性为99%,IDC的准确性为98%。此外,基于覆盖组织切片中所有ST点的自动识别表达签名进行分类,对DCIS的预测准确率为95%,对IDC的预测准确率为91%。
结论:这一概念研究表明,从专家选择的乳腺癌组织切片中获得的ST标记可以用于识别整个组织切片中的乳腺癌区域,包括未经过训练的区域。此外,所识别的表达特征可以高精度地对不用于训练的组织切片中的癌症区域进行分类。专家生成的甚至是自动生成的ST数据的癌症签名,将来可能能够对乳腺癌区域进行分类,为病理学家提供临床决策支持。
关键词:空间转录组学,表达特征,癌症诊断,乳腺癌,机器学习




网友评论