我这里使用python和biopython,关于python和Biopython的安装可以参考我的B站视频
image.png输入文件就是叶绿体基因组的fasta文件,经过注释你已经知道LSC/IR/SSC的位置坐标,比如自己的叶绿体基因组序列
1——80000是大单拷贝区
80001——100000是反向重复区1
100001——130000是小单拷贝区
首先是输出叶绿体基因组的总长度
image.png输出总的GC含量
image.png大单拷贝区的GC含量
image.png反向重复区
image.png小单拷贝区
image.png这里需要注意的是位置坐标是起始位置-1:终止位置
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!
网友评论