1.目的
在转录组数据下游分析时,可能会做荧光定量PCR,故需要转录本信息进行有关分析。下面记录我自己如何获得转录本信息的。需要提前准备的数据有,单条染色体的fasta序列和基因组gtf文件。
2.获取方法
2.1gtf文件获取转录本信息
通过grep命令获取目标基因的信息
grep "HYC85_020135" genes.gtf
#HYC85_020135是基因的名称,genes.gtf 是目标文件
会展示所有HYC85_020135有关的信息,主要是三大类:转录本、外显子、CDS。并记录了他们所处染色体和位置信息
2.2基因获取
awk '/^>/{p=0} {p+=length($0)} p>=74802832 && p<=74805770' CM025504.1.fasta > HYC85_020135.fasta
p>=74802832 && p<=74805770是基因的位置,CM025504.1.fasta是染色体的文件,HYC85_020135.fasta是输出文件,将结果输出到指定文件。
网友评论