背景:
RRBS数据bismark比对。
首先是从一篇简书上链接到这个参考基因组的链接,https://support.illumina.com/sequencing/sequencing_software/igenome.html,但是发现有40多G,于是放弃。
百度关键词“参考基因组下载”。
看了几篇文章之后推荐的是从UCSCs上下载基因组FASTA文件,然后从gencode上下载基因的注释文件。
下载hg19:
cd ~/reference
mkdir -p genome/hg19 && cd genome/hg19
nohup wget http://hgdownload.cse.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz &
tar zvfx chromFa.tar.gz
cat *.fa > hg19.fa
rm chr*.fa
下载hg38
cd ~/reference
mkdir -p genome/hg38 && cd genome/hg38
nohup wget http://hgdownload.cse.ucsc.edu/goldenPath/hg38/bigZips/hg38.fa.gz &
genecode网站上下载注释文件https://www.gencodegenes.org/human/release_35lift37.html,选择了第一个。
比较完整的下载流程可以看这篇。
https://www.jianshu.com/p/75404f813e0a
从UCSC上下载bed格式的注释文件
网友评论