前面通过视频给大家介绍一下我们要复现的内容
就是下面这篇文章的Table2
表格如下,一共有23种不同的肝炎病毒株
表格中,右上三角是23种病毒株的DNA序列,两两之间的序列相似性。左下三角是23种病毒株的氨基酸序列,两两之间的序列相似性。
今天我们先来计算,DNA序列两两之间的序列相似性。
1)数据获取这里文章的表格中已经给出了23个病毒株的ID号,在表格的行名中。直接贴到NCBI数据库就可以下载相应的DNA序列和氨基酸序列。
2)计算DNA序列两两之间的序列相似性,这里有23种病毒株,所以需要计算253次。
最终我们可以得到下面这个DNA序列两两之间的相似性
今天的分享就先到这里,希望对大家的科研有所帮助。
网友评论