（一）序列比对

作者: Gnaw | 来源:发表于2019-03-24 19:14 被阅读8次

5.序列比对（贯穿所有的生物信息学）
序列对位排列（sequence alignment）
2020-12-29 生信4.0序列比较（第二部分）
3️⃣ 多序列比对(1):简介
关于blast结果的一点解读
（一）序列比对
序列比对(三)——局部联配Smith-Waterman算法
TBtools基因家族分析详细教程(3)基因家族成员的进化分析1
基因家族分析（3）进化树构建及美化
「一文搞定序列比对算法」Global以及Local Alignm

1. 认识序列。

序列（sequence）：就是字符串（string）

s=abcdefghijklmnopqrstuvwxyz

通常用 $s_{i}$ 代表序列s 的第i个字符，比如 $s_{4}$ =d

通常用 s ’ 表示s 的子序列。

蛋白质序列：

是由20个不同的字母，也就是20种不同的氨基酸排列组合而成。

核酸序列：

是由4种不同的字母，也就是4种不同的碱基排列组合而成。核酸序列又分为DNA序列和RNA序列。

生物序列有自己的书写格式，而且格式很多。不同的处理软件会用到不同的格式，但是最常用的是

FASTA格式：

第一行是一个 > 开头，后面紧接注释信息

2. 数据库中的序列相似性：

对于一个已知序列却未知结构和功能的蛋白质，如果与它序列相似的某些蛋白质的结构和功能已知，那么就可以推测出这个未知结构和功能的蛋白质的结构和功能。简言之，相似的序列意味着相似的结构，相似的结构意味着相似的功能。

我们用 一致度 和 相似度 这两个指标来定量描述序列有多相似。

例如：

一个残基就是指一个字母（氨基酸或碱基）

一致度：如果两个序列（蛋白质或核酸）长度相同，那么他们的一致度定义为他们对应位置上相同的残基数目占总长度的百分比。上例一致度：2 $\div$ 4=50％

相似度：如果两个序列（蛋白质或核酸）长度相同，那么他们的相似度定义为他们对应位置上相似的残基与相同的残基的数目和占总长度的百分比。

相同可以找到，但相似怎么找呢？要解决这个问题，我们需要替换记分矩阵。

替换记分矩阵：是反映残基之间相互替换率的矩阵，它描述了残基两两相似的量化关系。比如图1 就是一个替换记分矩阵。矩阵种行和列分别是20种氨基酸，且两两之间有一个分值。根据这个分值就可以知道谁和谁相似，谁和谁不相似。

图1-BLOSUM-62 替换记分矩阵

DNA 序列的替换记分矩阵：

①等价矩阵：

等价矩阵

这个矩阵最简单，其中，相同核苷酸之间的匹配得分为1，不同核苷酸间的替换得分为0。由于不含有碱基的理化信息和不区别对待不同的替换，在实际的序列比较中很少使用，一般只用于理论计算。

②转换-颠换矩阵：

转换-颠换矩阵

核酸的碱基按照环结构特征被划分为两类，一类是嘌呤，包括腺嘌呤A和鸟嘌呤G，它们都有两个环；另一类是嘧啶，包括胞嘧啶C和胸腺嘧啶T，它们只有一个环。

如果DNA碱基的替换保持环数不变，则称为转换，比如A→G，或者C→T，也就是嘌呤变嘌呤，嘧啶变嘧啶。

如果环数发生变化，则称为颠换，比如A→C，或者T→G，也就是嘌呤变嘧啶，嘧啶变嘌呤。

大自然更倾向于接受嘌呤和嘌呤之间的替换，以及嘧啶和嘧啶之间的替换，而嘌呤和嘧啶之间的替换会导致不好的事情发生，这种替换大多在进化过程中被淘汰。

转换-颠换矩阵中，转换的得分为-1分，颠换的得分为-5分。

③BLAST矩阵：

BLAST矩阵

经过大量实际比对发现，如果令被比对的两个核苷酸相同时得分为+5分，不相同为-4分，这时比对效果最好。这个矩阵广泛地被DNA序列比较所采用。

5.序列比对（贯穿所有的生物信息学）
2019.10.22 勤奋，在思考和文献中游走。 1. 序列比对、DNA序列比对、蛋白质序列比对、BLAST比对搜...
序列对位排列（sequence alignment）
1. 什么是序列比对？序列比对的目的、意义和用途是什么？ 1.1：序列比对（sequence alignment）...
2020-12-29 生信4.0序列比较（第二部分）
在线双序列比对工具：EMBL全局双序列比对工具
3️⃣ 多序列比对(1):简介
序列比对和序列特征分析总目录关于多序列比对可以参考Wiki 定义：多序列比对是对3条以上（包括3条）DNA,R...
关于blast结果的一点解读
alignments 代表比对上的两个序列hits 表示两个序列比对上的片段Score 比对得分，如果序列匹配上得...
（一）序列比对
1. 认识序列。序列（sequence）：就是字符串（string） s=abcdefghijklmnopqr...
序列比对(三)——局部联配Smith-Waterman算法
原创：hxj7 关于全局联配的介绍可参见前文：序列比对（一）全局比对Needleman-Wunsch算法序列比对（...
TBtools基因家族分析详细教程(3)基因家族成员的进化分析1
新建文件夹进化分析1 包括1多序列比对与可视化Mega（Muscle）进行序列比对，JalView进行多序列比对结...
基因家族分析（3）进化树构建及美化
基因家族树构建最常用的方法是 NJ 法和 ML 方法，构建进化树之前，需要进行多序列比对。多序列比对多序列比对...
「一文搞定序列比对算法」Global以及Local Alignm
序列比对是什么以及序列比对主要的作用是什么，本篇博客就一笔带过，因为不是主要分享内容。序列比对，此处引申为pai...