这一视频讲的是somatic variants discovery,主要是集中在肿瘤样品上。视频地址:here
下面这幅图简单的展示了在肿瘤环境里的情况。在肿瘤发展的过程中,包含mutation events。There are a variety of things that happen within this tissue. Where you start with one cell that mutates and end up with a kind of cascades of events that leads to a tumor.在肿瘤里有很多种细胞lineages.有的细胞只是neutral mutation,不起任何的作用。但有些mutation,就像下面图里红色标记的driver mutations。这些mutation导致了肿瘤的发生。你要明白一点的是,当你取一块肿瘤样品进行测序的时候,你绝对不是在测某一群细胞,你是在测很多种细胞群,每一个细胞群又有自己的mutations。所以somatic的背景要比germline复杂的多。
下面说一下driver mutations。我们都知道有几种情况可以导致tumor。我们需要找到的是那些在肿瘤里response所有factors的variants,而不是我们本身就带有的那些mutations(from germline)。一般来说我们需要把肿瘤样品测序,并且把与之对应的正常样品进行测序,从而区分哪些是driver mutations。
一个比较困难的问题是,当你取样品的时候,你很难取到pure normal和pure tumor,因为在tumor的发展过程中,a lot of biology that's happening。大部分情况下,对应的正常样品是血液样品,然而即便是血液样品,你仍然会测序得到少量的循环肿瘤细胞(转移出来的)。
在germline的分析中,一般背景noise比较小,技术方面的noise也会相对小很多。但是在somatic context里,背景noise会大的多。所以你不能用germline分析的pipline去分析somatic样品。
需要提示的是,在cancer context里,你会有很多的somatic alterations。在germline分析中,你会看到你预料到的染色体组型,但是在肿瘤样品里,你会看到很多不同的结果。染色体有很多的缺失或者重组等等。
对于somatic的分析流程,主要有两个,分别是针对short variants和copy number variants。主讲人会在之后的视频里讲具体的细节。
先来看看第一种,short variants。下面这张图展示的是肿瘤-正常样品对照的结果。取的样品是肿瘤患者的tumor和他自身正常的组织。左边的紫色标记的位点只存在肿瘤样品里,我们可以认为它是潜在的somatic SNV,而中间黄色标记的位点在germline样品里也存在,所以这个位点并不是肿瘤样品里特有的。但是这样比较的前提是:你必须有配对的正常组织对照!
但是有的时候,你无法拿到患者的正常组织的时候该怎么办呢?这是你需要PON(panel of normal):
什么是PON呢?The panel of normals is a reference of panel that ultimately a list of variants that you generates from a bunch of normal samples. They can be completely unrelated to the subjects in your analysis. And the idea is to take samples that were sequenced generated with the same technology, processed in the same way.可以帮助我们降低noise。
对于copy number variants的分析,是与short variants分析完全不同的。实际上你是在分析在某一个given site上有多少coverage。从而推测copy number的增加或者是减少。在copy number variants的分析中,最重要的步骤是normalization。在计算coverage的比例后,需要对其标准化。具体的细节会在之后的视频里讲到。关于copy number variants的对照,你可以使用unrelated samples.
网友评论