官网链接:[Quick start — CNVkit 0.9.8 documentation]
简书参考:
CNVkit安装和使用 - 简书 (jianshu.com)
知乎参考:
CNVkit:基因组拷贝数变异检测利器 - 知乎 (zhihu.com)
CNVkit就是专门开发用于全基因组尺度拷贝数检测的一款软件。该软件的一大特点就是同时使用捕获的靶序列reads和非特异性的脱靶序列reads来推断分布在整个基因组中的基因拷贝数。
(https://cnvkit.readthedocs.io/en/stable/quickstart.html)
Install CNVkit
GitHub - etal/cnvkit: Copy number variant detection from targeted DNA sequencing
创建一个CNVkit的环境
使用conda安装
Download the reference genome
一个是参考基因组的fasta文件
一个是Gene annotation database
RefFlat文件
感觉是用于给没有基因名字的bed文件做注释用的
image.png
第一步:
使用BWA比对文件到参考基因组上
第二步:
Build a reference from normal samples and infer tumor copy ratios
- 使用normal的样本创建一个汇总的germline的CNV的reference
-
使用上述的reference去计算肿瘤样本中的CNV
这两步是自动化的,但是需要保证tumor以及normal的bam文件拥有一样的后缀
image.png
上述提到的bed文件都是些什么呢
image.png
因为这里我使用的是WGS的数据
因此直接跳到WGS的使用方法
网友评论