1.序列相似性比较和序列同源性分析
序列相似性比较:将待研究序列与DNA或蛋白质序列库进行比较,用于找出与此序列相似的已知序列。完成这一步只需要两两序列比对的算法。例如:BLAST、FASTA。
序列同源性分析: 将待研究序列与一组与之同源,但来自不同物种的序列进行多序列比较,以确定该序列与其他序列间的同源性大小。完成这一步需要多序列比对算法。例如:Clustal。
2.序列同源性分析(多序列比对)的意义
1.用于描述一组序列之间的相似性关系,以便了解一个基因家族的基本特征,寻找motif,保守区域。(motif:是蛋白质分子具有特定功能的或者作为一个独立结构域一部分相近的二级结构聚合体;)
2.用于描述一个同源基因之间的亲缘关系的远近,应用到分子进化分析中。
3.其他:构建profile、打分矩阵。
3.Clustal简介
Clustal是一种渐进的比对方法,先将多个序列两两比对构建距离矩阵,反映序列之间两两关系。然后根据距离矩阵计算产生的系统进化树,对关系密切的序列进行加权。然后从最密切的两条序列开始,逐步引入邻近的序列并不断重新构建对比,直到所以序列都被加入。
3.1ClustalW软件的下载和使用
软件下载:http://www.clustal.org/download/current/
由于多序列比对所要的时间较长,下面以linux服务器为例进行介绍( clustalw-2.1-linux-x86_64-libcppstatic.tar.gz )。
#解压并上传
下载完成后完成解压。打开终端将文件(解压后的程序文件和跑程序所需的序列放在一个文件夹)传到服务器:
scp -r localfile.txt username@192.168.0.1:/home/username/
password
其中:
1)scp是命令,-r是参数
2)localfile.txt 是文件的路径和文件名
3)username是服务器账号
4)192.168.0.1是要上传的服务器ip地址
5)/home/username/是要拷入的文件夹路径。
#运行
ssh username@192.168.0.1
password
cd /usr/hx/clustalw-2.1-linux-x86_64-libcppstatic
./clustalw2
#multiple alignments(多序列比对)
1)Your choice:1 #选择Sequence Input From Disc
2)Enter the name of the sequence file : 23_phages.fasta #输入输入文件的地址和文件名。
3)Your choice:2 #选择Multiple Alignments
4)Your choice:1 #选择Do complete multiple alignment now Slow/Accurate
5)先跑着,休息了。。。。。。
file
file
file
file
本文由博客一文多发平台 OpenWrite 发布!
网友评论