1. 软件介绍
ABSOLUTE软件可以评估癌症细胞的纯度/倍性,并以此计算绝对的拷贝数和突变倍数。从混合细胞(同时含有正常细胞和癌症细胞的组织、血液等)中提取DNA时,癌细胞的绝对拷贝数信息就会丢失,ABSOLUTE软件就可以重新提取这些数据。软件利用ABSOLUTE算法,先生成copy number的片段化信息(segment)文件,再利用癌细胞核型模型,体细胞点突变的等位基因频率(可选);输出结果中提供了DNA局部片段的细胞绝对拷贝数信息,对突变的突变等位基因数目。
2. 推荐参考文献:
https://www.nature.com/articles/nbt.2203.pdf
3. 输入文件
(1)使用HAPSEG作为输入:还需要安装HAPSEG的R包。关于如何安装这些包的说明可以在 http://cran.r-project.org/doc/manuals/R-admin.html# install -packages 中找到。
(2)使用tab分隔的segment文件:该文件必须包含 "Chromosome", "Start", "End", "Num_Probes" and "Segment_Mean" 这几列。您的文件可能包含除这些列之外的其他列,但至少必须指定这些列。要在此模式下运行,还必须将copy_num_type参数指定为“total”。
4. 处理过程
4.1 提取DNA
从癌症组织或血液(同时含有正常细胞和癌症细胞)的杂合细胞群体中提取DNA。
![](https://img.haomeiwen.com/i18064756/fcfff8f8effba984.png)
4.2 对DNA拷贝数进行片段化和平滑化
图为用ABSOLUTE软件处理肺腺癌肿瘤细胞群体的示例,展示了同源染色体全基因组范围内局部区域的CNV情况。横轴是基因组位置,纵轴是DNA浓度。根据DNA的reads数来推断DNA的拷贝数。
4.3 Homologous copy ratio histogram.
![](https://img.haomeiwen.com/i18064756/dd2a0e27fec7d0ea.png)
b图中copy ration 的bin分辨率是0.04,可以看到几个离散的SCNA峰,每个峰值对应一个
在体细胞克隆或亚克隆中发生变异的拷贝数状态。
4.4 调用癌症核型模型
ABSOLUTE调用预先计算的癌症核型模型。如果提供体细胞点突变数据集,就可以据此推断DNA浓度。
![](https://img.haomeiwen.com/i18064756/3fde761e231c635e.png)
4.5 copy ratio 的3种展示
用3种方式展示copy ratio的结果。图中水平虚线是与体细胞拷贝数相对应的cipy ratios。
![](https://img.haomeiwen.com/i18064756/f966292c46c241c1.png)
4.6 肿瘤细胞纯度和癌基因组倍性
纯度(肿瘤细胞核的比例)和癌症基因组倍性值对应于(e)中的每一种解释。
![](https://img.haomeiwen.com/i18064756/94fa27c02914eab9.png)
![](https://img.haomeiwen.com/i18064756/2f26b1da0820d4b3.png)
5. 算法简单介绍
假定癌症组织混合物中癌症细胞的比例是:α,
正常细胞的比例是: 1-α,
基因组中的每个基因座位点为:x,
癌症细胞中基因座的整数拷贝数:q(x),
癌细胞的平均倍性:τ,
那么,在混合组织中,位点x的绝对拷贝数是α q(x) +2(1 − α),
平均倍性(D)是:ατ + 2(1 − α),
因此,位点x的拷贝数是:R(x) = (a q(x) + 2(1 − a))/D = (a /D) q(x) + (2(1 − a)/D),
体细胞的点突变计算式是:F(x) = (a sq(x))/Ds = (a /Ds )sq (x)
网友评论