美文网首页
blast比对

blast比对

作者: Cheng_WANG | 来源:发表于2022-04-06 23:14 被阅读0次

使用blast在鱼的基因组上识别C-lectin基因

1. 下载基因组

wget -c ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/002/994/505/GCA_002994505.1_ASM299450

v1/GCA_002994505.1_ASM299450v1_genomic.fna.gz -O Seriola_quinqueradiata.fa.gz

gunzip Seriola_quinqueradiata.fa.gz

2. 获得C-lectin基因序列

cat > C_lectin.fa

>C-LECTIN

MKTLLILSVVLCAALSVRAAAVVPAEAATAQLGDKAAPEPEAVKDTAVEDTAVEETAVEDTAVEETAVEDTAVEETAVED

TAVEETAVEDTAVEDTAVEDTAVEDTAVEDTAVEETAVEDTAVEDTAVEDTAVAAGRPAGLRQTRLSFCLDGWQSFSGKC

YFLANHPDSWANAERFCASYEGSLASVGSIWEYNFLQRMVKTGGHAFAWIGGYYFQGEWRWEDGSRFDY

SNWDTPRSTAYYQCLLLNSQVSMGWSNNGCNMNFPFVCQVRQLNC

3. 构建基因组数据库

makeblastdb -in Seriola_quinqueradiata.fa -dbtype nucl -input_type fasta -out SerRivdb

-in 输入的建库序列文件

-dbtype 数据库的类型(核酸或蛋白质)

-input_type  输入的文件格式

-out 产生数据库的文件前缀

4. blast gene to genome

tblastn -db SerRivdb -query C_lectin.fa -out blastout.txt

获得更精确易读的结果

tblastn -db SerRivdb -query C_lectin.fa -outfmt '6 qseqid sseqid pident length mismatch gapopen qstart qend sstart send evalue bitscore qcovs salltitles' -num_threads 16 -out blastout2 .txt

挑选结果

more blastout2.txt | awk '$3>50'

确认结果,将比对筛选得到的序列再回比到NR数据库,确认比对的正确性。

相关文章

网友评论

      本文标题:blast比对

      本文链接:https://www.haomeiwen.com/subject/oqodsrtx.html