美文网首页
二代测序:Phred33和Phred64格式判断

二代测序:Phred33和Phred64格式判断

作者: bioshimmer | 来源:发表于2024-01-25 16:47 被阅读0次

原理:取10000行,求平均碱基质量,来判断格式

import gzip
from pickle import bytes_types
from statistics import mean
def line_chr_ascii(aline):
    #print(f'line_chr_ascii:{aline}')
    nline = []
    for i in aline:
        nline.append(ord(i))
    return nline
def main():        
    inputfile = "/data3/Pugionium_cornutum_population/pc-y101-1/3_1_GCCAAT_L008_R1_001.fastq.gz"
    readnum = 0
    qual_list = []
    f = gzip.open(inputfile,'r')
    i = 0
    while i<10001:#取10000行
        line = f.readline().rstrip()
        line = bytes.decode(line)
        #print(line)
        if '@' in line:
                readnum = readnum+1
                i = i+1
        elif '+' in line:
            line = f.readline().rstrip()
            line = bytes.decode(line)
            line = line_chr_ascii(line)
            qual_list = qual_list+line
            i = i+2
        else:
            i=i+1
        
    f.close()
    qual_mean = mean(qual_list)
    print(f'read numbers total:{readnum}')
    print(f'qual mean:{qual_mean}')
    print(f'Phred 33:{qual_mean-33}')
    print(f'Phred 64:{qual_mean-64}')
    readnum = None
    qual_list = None
image.png

很明显是phred33格式的

相关文章

  • Fastq 格式说明 & (Phred33 or Phred64

    Fastq格式是一种基于文本的存储生物序列和对应碱基(或氨基酸)质量的文件格式。最初由桑格研究所(Wellcome...

  • 二代测序基础知识

    二代测序基础知识 二代测序基础概念 (这个是与二代测序相关每个部门都要掌握的) FQ数据格式 高通量测序(如Ill...

  • 测序数据的解析:Fastq与FastQC

    Fastq格式 二代测序平台获得的原始数据为fastq(或为压缩文件fq.gz)格式,包含双末端测序所得的正向和反...

  • 学习小组Day7笔记--Xiaofan1991

    测序知识整理 一、测序原理 主要理解一代测序和二代测序的原理,分子生物学基本都有讲,基本都忘了。 二、测序数据格式...

  • Day7——边边

    测序知识 今天主要介绍了测序的一些知识,测序的原理,测序的发展,测序的应用,常用的数据格式等,目前二代测序(NGS...

  • Day2-xiaode

    二代测序数据的分析 学习目标 解释测序技术如何形成NGS 描述FASTQ、SAM/BAM和VCF数据格式 比较将N...

  • 测序原理免费资源收集

    一代测序 Sanger 测序 二代测序 Illumina测序HiSeq工作原理二代测序原理及fastq数据 三代测...

  • 学习小组Day7笔记-hasey

    测序知识 区分一二三代测序 二代测序大体流程 NGS组学包括哪些分类 1.测序过程和原理

  • 学习小组Day7--二胖

    测序知识 一代测序flow 二代测序flow

  • 数据过滤

    二代测序数据过滤 1.基因测序技术 2.二代测序比较 3.测序通用流程 4.测序数据错误(针对每项过滤) 5.测序...

网友评论

      本文标题:二代测序:Phred33和Phred64格式判断

      本文链接:https://www.haomeiwen.com/subject/abjvodtx.html