1、材料
隐马尔科夫模型矩阵文件
目标物种所有蛋白质序列
1、从pfam下载模型文件
2、从NCBI下载拟南芥所有蛋白质序列
2、流程
模型文件 ---搜索--->一堆序列---构建模型---->
新模型文件---搜索--->一堆序列【如果无新序列结束,否则重复】
3、
#1用模型搜索
#hmmsearch --cut_tc --domtblout out.txt A.hmm B.pep.all.fa
hmmsearch --cut_tc --domtblout out.txt RRM_DME.hmm GCF_000001735.4_TAIR10.1_protein.faa
#2提取搜索结果中的from to部分序列,构建拟南芥的特异hmm模型
perl scripts/domain_xulie.pl out.txt GCF_000001735.4_TAIR10.1_protein.faa domain_out.fa 1e-20
#3clustalw多序列比对
#4用hmmbuild构建新的模型文件
hmmbuild new_RRM_DME.hmm domain_out.aln
网友评论