利用r语言实现DNA双序列全局比对（Needleman-wuns

利用r语言实现DNA双序列全局比对（Needleman-wuns

作者: 七禾叶瓣 | 来源:发表于2021-01-26 14:39 被阅读0次

利用r语言实现DNA双序列全局比对（Needleman-wuns
2020-12-29 生信4.0序列比较（第二部分）
3️⃣ 多序列比对(1):简介
基于动态规划进行双序列全局比对
用C语言实现DNA双序列滑动比对
用Python和C语言实现DNA双序列全局比对（Needlema
在Windows系统中搭建本地Blast序列比对环境
5.序列比对（贯穿所有的生物信息学）
用Python和C语言实现DNA双序列简单比对
序列比对(三)——局部联配Smith-Waterman算法

序列比对实验报告

一．实验内容

1.利用序列比对线上工具做序列比较
2.Blast线上工具使用
3.使用r语言实现Needleman-Wunsch算法

二．实验目的

1.掌握序列比对线上工具使用
2.掌握双序列比对算法——Needleman-wunsch算法

三．实验数据工具及步骤

1. 利用序列比对线上工具做序列比较
在Swiss-port下载蛋白序列，以BRCC3_HUMAN和 BRCC3_MOUSE的蛋白质序列为例，利用EMBL 网站的双序列比对工具
2.Blast线上工具使用
同样利用NCBI网站blast在线分析，blastp
3.实现Needleman-Wunsch算法
1）先把已知的替换积分矩阵导入

替换记分矩阵
2）把要比对的序列文件导入，直接写两行序列
例如:

序列

3）实现用Needleman-Wunsch 算法得出打分矩阵，根据公式和替换记分矩阵算出
公式

公式

四．实验代码

setwd("F:\\实验\\转录组学\\实验一")
matrix<-read.table("matrix.txt",header=T) #导入打分矩阵，行列名AGCT
str(matrix)
colnames(matrix)<-c("A","G","C","T") #设置列名

替换记分矩阵

seqdata<-read.table(“seqdata.txt”,as.is=T)
seqdata#导入序列，如图

序列

#转化成单个字符
seqdata<-as.matrix(seqdata)
seqdata1<-seqdata[1,]#提取序列1
seqdata2<-seqdata[2,]#提取序列2
#统计序列长度
M<-nchar(seqdata1)
N<-nchar(seqdata2)
seqdata1<-strsplit(seqdata1,"",fixed=T)
seqdata2<-strsplit(seqdata2,"",fixed=T)
zseqdata1<-as.character(unlist(seqdata1))
zseqdata2<-as.character(unlist(seqdata2)) #zseqdata1和zseqdata2是转化成单个字符后的序列

#Needleman-Wunsch 算法
gap=-5#已知gap
scorematrix<-matrix(0,N+1,M+1)#构造空矩阵，N+1行,M+1列
rownames(scorematrix)<-c(0,zseqdata2)
colnames(scorematrix)<-c(0,zseqdata1)
#计算第一行第一列
scorematrix[1,1]=0
for (i in 0:N+1)
scorematrix[i,1]=gap*(i-1)
for (j in 0:M+1)
scorematrix[1,j]=gap*(j-1)

#计算剩下的
for (i in 1:N+1)
for (j in 1:M+1)
 {
scorematrix[i,j]=max(c(scorematrix[i-1,j-1]+matrix[rownames(scorematrix)[i],colnames(scorematrix)[j]],
 scorematrix[i-1,j]+gap,
 scorematrix[i,j-1]+gap))
}
scorematrix

五．实验结果：

分析:Gap open越大,比对空位减少,得分越低,gap越集中

Gap extend变化,比对结果没有发生变化,而gap越分散

PAM-n矩阵，n越大,序列相似度越低,BLOSUM-n矩阵，n越大，序列相似度越高

回溯表示R语言代码现在还没想出来，如果有写出来的小伙伴可以交流分享吖

补充:Needleman-wunsch算法原理是设置打分矩阵，根据适当的打分公式来对对应的碱基进行打分，有四种情况：1.两碱基完全匹配2.不匹配3.第一条序列引入空位4.第二条序列引入空位

具体算法：

替换记分矩阵

公式

已知gap=-5
1.写出替换打分矩阵

s(1,1)=10,由s(0,0）得到，箭头指向s(0,0) (哪个格子算出来的箭头就指向哪里）

依次算出，最终得到替换打分矩阵

2.写出比对序列
比对结果:
最终得分为右下角的数字
score=21
从这开始，依次往回找箭头，如图蓝色箭头
书写比对结果：先把第一个序列写出来
A C G T C
然后从最左边开始写，横箭头和竖箭头表示字母对空，斜箭头表示字母对字母，第一个是A对A,第二个是C对空，依次对应,结果如图:

image.png

比对结果.png
斜箭头代表第一个对应第二个
横箭头代表第一个对空
竖箭头代表空对第二个
这样看来,序列比对四不四挺简单呢

相关文章

利用r语言实现DNA双序列全局比对（Needleman-wuns
序列比对实验报告一．实验内容 1.利用序列比对线上工具做序列比较2.Blast线上工具使用3.使用r语言实现Ne...
2020-12-29 生信4.0序列比较（第二部分）
在线双序列比对工具：EMBL全局双序列比对工具
3️⃣ 多序列比对(1):简介
序列比对和序列特征分析总目录关于多序列比对可以参考Wiki 定义：多序列比对是对3条以上（包括3条）DNA,R...
基于动态规划进行双序列全局比对
说明核酸序列打分算法脚本,基于动态规划进行双序列全局比对,得到两条DNA序列的相似度并打分,但程序还有一些问题,...
用C语言实现DNA双序列滑动比对
DNA双序列滑动比对也是比较简单的一种比对方式算法思想大概如下：假设有两条DNA序列：ATCGCAG 和ATC，...
用Python和C语言实现DNA双序列全局比对（Needlema
双序列全局比对主要是依据Needleman-Wnnsch算法来进行整个过程分为三步1.设置一个矩阵：第一条序列长...
在Windows系统中搭建本地Blast序列比对环境
在实验室中，我们经常需要对分子生物学数据进行分析，常见的有DNA和蛋白质分子序列比对。分子序列比对分为全局序列比对...
5.序列比对（贯穿所有的生物信息学）
2019.10.22 勤奋，在思考和文献中游走。 1. 序列比对、DNA序列比对、蛋白质序列比对、BLAST比对搜...
用Python和C语言实现DNA双序列简单比对
这是DNA双序列比对类型中最简单的一种，要求输入的两条序列长度相同，通过运行代码给出两条序列的比对得分 Pytho...
序列比对(三)——局部联配Smith-Waterman算法
原创：hxj7 关于全局联配的介绍可参见前文：序列比对（一）全局比对Needleman-Wunsch算法序列比对（...

网友评论

本文标题：利用r语言实现DNA双序列全局比对（Needleman-wuns

本文链接：https://www.haomeiwen.com/subject/blyhnktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|利用r语言实现DNA双序列全局比对（Needleman-wuns|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！