简介
非编码RNA(Non-coding RNA)指包括rRNA,tRNA,snRNA,snoRNA 和microRNA 等不编码蛋白质的RNA,它们转录后直接在RNA 水平上就能行使各自的生物学功能,并不需要翻译成蛋白质。
注释方法
- INFERNAL + Rfam
INFERNAL + Rfam 可以行使较为复杂的ncRNA注释,结果包括rRNA,tRNA,snRNA,snoRNA 和microRNA的始末位点,对比情况等信息。
# install the package with conda
conda install -c bioconda infernal
# download Rfam data
wget ftp://ftp.ebi.ac.uk/pub/databases/Rfam/CURRENT/Rfam.cm.gz
gunzip Rfam.cm.gz
wget ftp://ftp.ebi.ac.uk/pub/databases/Rfam/CURRENT/Rfam.clanin
# cmpress
cmpress Rfam.cm
# Estimation of the genome size
## Total = ( gene base number X 2/1,000,000 m
# ncRNA anotation
cmscan -Z 100 --cut_ga --rfam --nohmmonly --tblout genome.tblout \
--fmt 2 --cpu 8 --clanin Rfam.clanin Rfam.cm genome.fa > genome.cmscan
- tRNAscan-SE
tRNAscan-SE 一般用于tRNA注释,是从1997年发表至今还在维护更新的元老级工具,现在已经不再限制输入的序列数据大小,简单好用。
# Dependencies
## Infernal package
# install the package with conda
conda install -c bioconda trnascan-se
# usage
tRNAscan-SE -o XXX_tRNA.out -f XXX_tRNA.ss -m XXX_tRNA.stats groups.asm.fasta
- RNAMMER
RNAMMER 用于注释rRNA,需要学校或者科研机构的邮箱才可以下载。
reference
- tRNAscan-SE: https://github.com/UCSC-LoweLab/tRNAscan-SE/blob/master/README
- infernal: http://eddylab.org/infernal/
- Chan PP, Lowe TM. tRNAscan-SE: Searching for tRNA Genes in Genomic Sequences. Methods Mol Biol. 2019;1962:1-14. doi:10.1007/978-1-4939-9173-0_1
- .dtu(RNAMMER ): https://services.healthtech.dtu.dk/
- INFERNAL User’s Guide: http://eddylab.org/infernal/Userguide.pdf
网友评论