我们平时对基因组进行生物信息学分析常常需要画出基因的结构图,即内含子与外显子所在的位置,而进行基因的结构绘制则需要cDNA序列与相对应的DNA序列进行比对。cDNA序列的获取较为简单,DNA序列的获取则较为繁琐,因此提取出DNA序列则为构建基因结构的关键点。我们可以用如下方法进行基因结构图的构建:
1.cDNA序列获取
cDNA序列的获取比较简单一般可从基因组数据库直接获取
2.gDNA序列获取
gDNA序列获取比较复杂,需要从全基因组数据库中提取出cDNA相对应的DNA序列,因此这里需要两个文件,全基因组数据库和cDNA数据库,同时还需要一个生物信息学分析软件BioEdit。
2.1具体思路
2.1.1首先利用BioEdit构建本地全基因组数据库
打开BioEdit,按照如下操作选择下载好的全基因组数据进行加载
构建本地数据库2.1.2利用鉴定好的cDNA序列对全基因组数据库进行搜索
Local BLAST打开本地数据库,如下图所示选择导入的全基因组数据库,在输入框用快捷键粘贴进cDNA序列进行数据库搜索。
2.1.3结果分析
搜索结果显示有多条序列,选择得分最高的序列进行分析。query显示的是输入的序列,sbjct为与之匹配上的序列,找到两条序列相对应的序列号即可。
2.1.4 gDNA序列的提取
用BioEdit打开全基因组数据库如图1所示,点击Edit-Search-Find in title,输入框内输入与cDNA序列匹配上的序列号例如:sceffold8447查找即可,在此要注意查找到的序列号与输入的序列号要一致。双击查找到的序列结果如图2所示,根据3.2中得到的序列号进行DNA序列的提取,选择复制即可。若与cDNA序列匹配的DNA序列,序列号由大到小则用DNAstar对其进行处理得到其反向互补序列(Editseq-输入提取的DNA序列并选择之-goodles menu-reverse Complement即可)
图1 图 23.基因结构图的构建
利用GSDS在线分析软件,上传cDNA序列和DNA序列提交就可得到如下图所示的结果。
基因结构图
网友评论