美文网首页
人类基因组的下载

人类基因组的下载

作者: wo_monic | 来源:发表于2020-07-07 15:21 被阅读0次

    参考地址1
    参考地址2

    人类基因组和GTF文件
    • NCBI:

    gff3

    hg38
    wget ftp://ftp.ncbi.nlm.nih.gov/genomes/Homo_sapiens/GFF/ref_GRCh38.p7_top_level.gff3.gz
    hg19
    wget ftp://ftp.ncbi.nlm.nih.gov/genomes/Homo_sapiens/ARCHIVE/BUILD.37.3/GFF/ref_GRCh37.p5_top_level.gff3.gz

    • ensembl:
    gtf

    wget ftp://ftp.ensembl.org/pub/current_gtf/homo_sapiens/Homo_sapiens.GRCh38.90.gtf.gz ## hg38
    wget ftp://ftp.ensembl.org/pub/release-75/gtf/homo_sapiens/Homo_sapiens.GRCh37.75.gtf.gz ## hg19

    变换中间的release就可以拿到所有版本信息:ftp://ftp.ensembl.org/pub/

    UCSC下载GTF文件

    下载地址
    从中选择需要的下载。

    不要再从http://genome.ucsc.edu/cgi-bin/hgTables页面手动选了,现在已经整合到https://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/genes/这个地址下面了
    基因组下载

    UCSC里面下载:

    wegt http://hgdownload.cse.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz ##hg19
    wget http://hgdownload.cse.ucsc.edu/goldenPath/hg38/bigZips/chromFa.tar.gz ##hg38

    tar -zxvf chromFa.tar.gz
    cd chroms
    cat *.fa >hg19.fa

    NCBI下载
    ##hg19:
    for i in $(seq 1 22) X Y M;
    do wget ftp://ftp.ncbi.nlm.nih.gov/genomes/Homo_sapiens/ARCHIVE/BUILD.37.3/Assembled_chromosomes/seq/hs_ref_GRCh37.p5_chr${i}.fa.gz; 
    gzip -d hs_ref_GRCh37.p5_chr${i}.fa.gz;
    cat hs_ref_GRCh37.p5_chr${i}.fa.gz >>hg19.fa;
    done;
    ##hg38:
    同理,只要找到下载地址,改动一下即可。
    ### ftp://ftp.ncbi.nlm.nih.gov/genomes/Homo_sapiens/Assembled_chromosomes/seq/hs_ref_GRCh38.p7_chr${i}.fa.gz
    

    ensembl中选择基因组一般选择toplevel-sm版本的。
    修改其中的release 号,就能获得对应的版本
    ftp://ftp.ensembl.org/pub/release-100/fasta/homo_sapiens/dna/

    各种基因组版本的差异

    相关文章

      网友评论

          本文标题:人类基因组的下载

          本文链接:https://www.haomeiwen.com/subject/spwaqktx.html