在处理基因组信息的时候,我们时不时需要统计序列的碱基个数,对于较少批量的数据来说,word文档或者其他文本处理工具或者samtools等可以进行处理,但是在面对大的fastq文件的时候,会显得苍白无力,下面分别介绍两种处理方式
1.针对单个序列进行处理
2.针对序列文件
对于文件处理是建立在对单个序列处理的基础之上的,通过对文件的逐行读取和判断来辨别序列行,从而对其进行计数,计数原理一样。
按照上述小程序进行运行可以得出序列的碱基个数。
在处理基因组信息的时候,我们时不时需要统计序列的碱基个数,对于较少批量的数据来说,word文档或者其他文本处理工具或者samtools等可以进行处理,但是在面对大的fastq文件的时候,会显得苍白无力,下面分别介绍两种处理方式
1.针对单个序列进行处理
2.针对序列文件
对于文件处理是建立在对单个序列处理的基础之上的,通过对文件的逐行读取和判断来辨别序列行,从而对其进行计数,计数原理一样。
按照上述小程序进行运行可以得出序列的碱基个数。
本文标题:python小程序--计算序列碱基个数
本文链接:https://www.haomeiwen.com/subject/euinfqtx.html
网友评论