TransVar
官网地址:https://bitbucket.org/wanding/transvar/src/master
Web地址 :https://bioinformatics.mdanderson.org/public-software/transvar
github 地址 :https://github.com/zwdzwd/transvar
1.下载和安装
git clone https://github.com/zwdzwd/transvar.git
# 或者
wget https://github.com/zwdzwd/transvar/archive/v2.5.9.20190830.zip
unzip v2.5.9.20190830.zip
cd transvar-2.5.9.20190830
#默认安装路径,安装完成后,会生成在和安装时使用的python在同一个路径下
pip3 install --user transvar 或者 python3 setup.py install
which transvar
os.path.dirname(PYTHON_PATH)/bin/transvar
#安装在指定目录,安装完成后,在指定目录setdir下会生成bin/ 和 lib/两个目录
cd ../ && mkdir transvar-v2.5.9.20190830
python3 setup.py install --prefix=../transvar-v2.5.9.20190830
#需要将路径加入PATH和PYTHONPATH中
export PATH=${setdir}/bin:$PATH
export PYTHONPATH=${setdir}/lib/python3.7/site-packages:$PYTHONPATH
文献下载:
python3 $PATH/scihub.py/scihub/scihub.py -d https://pubmed.ncbi.nlm.nih.gov/26513549/
2.数据库下载:
1)下载注释数据库
transvar config --download_anno --refversion hg19
#查看脚本获得数据库下载地址
http://zwdzwd.io/transvar_user/annotations/
2)下载参考基因组,如果有,可以拷贝到 os.path.dirname({PYTHON_PATH})/lib/python3.7/site-packages/transvar/transvar.download/
transvar config --download_ref --refversion hg19
3)链接数据库,可通过命令行添加。最开始,不存在transvar.cfg这个文件,在第一次链接后,会创建transvar.
cfg文件,并将你创建的对应关系写入文件中,transvar.cfg 存放的路径:os.path.dirname({PYTHON_PATH})/lib/python3.7/site-packages/transvar/transvar.cfg
transvar config -k reference -v $PATH/ucsc.hg19.fasta --refversion hg19
transvar config -k aceview -v $PATH/hg19.aceview.gff.gz.transvardb --refversion hg19
transvar config -k ccds -v $PATH/hg19.ccds.txt.transvardb --refversion hg19
transvar config -k ensembl -v $PATH/hg19.ensembl.gtf.gz.transvardb --refversion hg19
transvar config -k gencode -v $PATH/hg19.gencode.gtf.gz.transvardb --refversion hg19
transvar config -k kg -v $PATH/transvar.download/hg19.knowngene.gz.transvardb --refversion hg19
transvar config -k refseq -v $PATH/hg19.refseq.gff.gz.transvardb --refversion hg19
transvar config -k ucsc -v $PATH//hg19.ucsc.txt.gz.transvardb --refversion hg19
cat lib/python3.7/site-packages/transvar/transvar.cfg
[DEFAULT]
refversion = hg19
[hg19]
reference = $PATH/ucsc.hg19.fasta
refseq = $PATH/hg19.refseq.gff.gz.transvardb
ccds = $PATH/hg19.ccds.txt.transvardb
ucsc = $PATH/hg19.ucsc.txt.gz.transvardb
gencode = $PATH/hg19.gencode.gtf.gz.transvardb
aceview = $PATH/hg19.aceview.gff.gz.transvardb
ensembl = $PATH/hg19.ensembl.gtf.gz.transvardb
kg = $PATH/hg19.knowngene.gz.transvardb
若直接修改transvar.cfg文件,不起作用,可能transvar config -k 命令,除了修改transvar.cfg,还修改了其他文件
3.使用
1)已知 p. 进行注释,可以一次只注释一个数据库,也可以同时注释多个数据库
transvar panno -i 'ERBB2:p.Leu755_Thr759del' --aceview --ccds --ensembl --gencode --kg --refseq --ucsc
2)根据基因组位置,进行注释,chr:g.start_endA>G
transvar ganno -i 'chrX:g.47038885_47038902del' --aceview --ccds --ensembl --gencode --kg --refseq --ucsc
网友评论