前面给大家简单介绍了如何从TCGA数据库下载CNV(拷贝数变异数据),以及如何使用R语言来合并CNV数据。
今天我们来基于合并之后的CNV矩阵来重现一篇SCI文章中的棒棒糖图 。首先我们来看看文章中的Figure长什么样。看上去是不是很像棒棒糖,这也是这个图名字的由来。
这张图来自2022年2月22日发表在frontiers in immunology杂志上的一篇文章。Molecular Characteristics, Clinical Significance, and Cancer Immune Interactions of Angiogenesis-Associated Genes in Gastric Cancer。最新的影响因子有8.786,还是很不错的一篇文章。
我们来看看这张图,怎么样来理解。弄清楚了这张图的含义,其实画起来就容易了。这张图的横轴是比较关注的候选基因,这篇文章里面是36个血管生成相关的基因。当然我们可以用任何热点相关的基因集来替换。小编前面已经给大家分享了很多。
这张图的纵轴是基因在所有样本里面发生拷贝数增加和拷贝数减少的比例。我们拿VEGFA这个基因来举个例子。假设我们有100个样本,统计发现VEGFA这个基因在14个样本里面发生了拷贝数增加,也就是拷贝数>2,因此红色柱子的高度是14%。 VEGFA这个基因在1个样本里面发生了拷贝数减少,即拷贝数<2,蓝色柱子的高度是1%。这个基因在剩下的85个样本里面的拷贝数是正常的。剩下的每一个柱子,都代表一个基因。
可能有些小伙伴会纳闷了,为什么同一个基因,既会发生拷贝数增加又会发生拷贝数减少。我们知道肿瘤的异质性是很强的,所以同一个基因在某些样本中发生拷贝数增加,在另外的样本里发生拷贝数减少是很常见的。
基于我们上次☞R语言合并TCGA中CNV矩阵 合并的CNV矩阵,最终可以得到下面这张图棒棒糖图。
网友评论