主要介绍了为什么存在不同版本的基因组数据。
英文原文:http://lh3.github.io/2017/11/13/which-human-reference-genome-to-use
中文解读可见https://www.jianshu.com/p/3806afaf0c8c
涉及ALT contigs的处理、多点定位序列、GRCh37和GRCh38线粒体基因组差异及未定位序列等。
下载UCSC上chr22.fa数据
分析发现chr22zhi'y
# -c表示保留原始文件压缩
wget http://hgdownload.cse.ucsc.edu/goldenPath/hg38/chromosomes/chr22.fa.gz | gunzip -c > chr22.fa
网友评论