最近在做水稻基因组注释,对于注释结果进行整理过滤,还在探索中。
evm注释结果
![](https://img.haomeiwen.com/i25274977/30a4a3f022a7f495.png)
将结果转化成蛋白文件:
gffread H7L1.EVM.all.gff -g ~/task/222anno/21/data/H7L1.arrow.polish.fasta -y cds.fa
![](https://img.haomeiwen.com/i25274977/ebd449b6fbf33f0e.png)
提取长度大于100bp的序列
bioawk -c fastx 'length($seq) > 100{ print ">"$name; print $seq }' cds.fa > 100.fa
查看结果:
![](https://img.haomeiwen.com/i25274977/f7718f2e0468bed3.png)
共有41659条注释结果
对比过滤前
![](https://img.haomeiwen.com/i25274977/a6ce1c47cef3b782.png)
但是不同群体注释的结果差异较大,目前还在探索中,以后结果会更新。
网友评论