把ensembl的gtf和fasta改成chr

作者: 苏牧传媒 | 来源:发表于2018-10-21 23:24 被阅读5次

fasta:

samtools faidx GRCh38.fa

samtools faidx GRCh38.fa 1 > chr1.fa ...

cat chr* > GRCh38.fa (前面三步主要是去除其他不需要染色体)

sed 's/>/>chr/g' GRCh38.fa > GRCh38_chr.fa

samtools faidx GRCh38.fa

samtools faidx GRCh38_chr.fa

GTF:

sed -i '/^#/d' GRCh38.gtf (去除#的注释信息)

sed -i '/^MT/d' GRCh38.gtf (去除MT染色体)

sed -i '/^KI/d' GRCh38.gtf (去除其他乱七八糟)...

awk '{print "chr"$0}' GRCh38.gtf > GRCh38_chr.gtf

awk '{print $1}' GRCh38.gtf | sort | uniq

awk '{print $1}' GRCh38_chr.gtf | sort | uniq

GFF同上

相关文章

网友评论

    本文标题:把ensembl的gtf和fasta改成chr

    本文链接:https://www.haomeiwen.com/subject/zigizftx.html