美文网首页
2018-04-10---关于FastQ和FastA(转载)

2018-04-10---关于FastQ和FastA(转载)

作者: 天秤座的机器狗 | 来源:发表于2018-04-10 22:46 被阅读71次

一、关于Fastq

FASTQ是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。其序列以及质量信息都是使用一个ASCII字符标示,最初由Sanger开发,目的是将FASTA序列与质量数据放到一起,目前已经成为高通量测序结果的事实标准。

二、Fastq的格式

FASTQ文件中每个序列通常有四行:第一行,序列标识以及相关的描述信息,以‘@’开头;第二行是序列;第三行以‘+’开头,后面是序列标示符、描述信息,或者什么也不加;第四行,是质量信息,和第二行的序列相对应,每一个序列都有一个质量评分,根据评分体系的不同,每个字符的含义表示的数字也不相同。

例如

[plain] view plain copy

@SEQ_ID  

GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT  

+  

!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65  

三、关于Fasta

Fasta格式也称为Pearson格式,是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释。

四、Fasta格式

Fasta格式首先以大于号“>”开头,接着是序列的标识符;换行后是序列的描述信息。换行后是序列信息,文件每行的字母一般不应超过80个字符。序列中允许存在空格,换行,空行,直到下一个大于号或文件结束,表示该序列的结束。

[plain] view plain copy

>gi|46575915|ref|NM_008261.2| Mus musculus hepatic nuclear factor 4, alpha (Hnf4a), mRNA  

GGGACCTGGGAGGAGGCAGGAGGAGGGCGGGGACGGGGGGGGCTGGGGCTCAGCCCAGGGGCTTGGGTGG  

CATCCTGGGCCGGGCAGGACAGGGGGCTAAGGCGTGGGTAGGGGAGAATGCGACTCTCTAAAACCCTTGC  

CGGCATGGATATGGCCGACTACAGCGCTGCCCTGGACCCAGCCTACACCACCCTGGAGTTTGAAAATGTG  

CAGGTGTTGACCATGGGCAATGACACGTCCCCATCTGAAGGTGCCAACCTCAATTCATCCAACAGCCTGG  

GCGTCAGTGCCCTGTGCGCCATCTGTGGCGACCGGGCCACCGGCAAACACTACGGAGCCTCGAGCTGTGA  

CGGCTGCAAGGGGTTCTTCAGGAGGAGCGTGAGGAAGAACCACATGT  

相关文章

  • 2018-04-10---关于FastQ和FastA(转载)

    一、关于Fastq FASTQ是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。其序列以及质...

  • fasta文件与fastq文件相互转化

    fastq转化为fasta 一般应该是由fastq转化为fasta(给出四种): fasta改为fastq fas...

  • FASTA和FASTQ

    FASTA FASTA文件主要由两个部分构成:序列头信息(有时包括一些其它的描述信息)和具体的序列数据。头信息独占...

  • FASTA和FASTQ

    在WGS数据的分析过程中,我们会接触到许多生物信息学/基因组学领域所特有的数据文件和它们特殊的格式,在这一节中将要...

  • fasta格式转fastq格式

    比对软件比如bowtie并不支持比对fasta格式的文件,所以需要把fasta转为fastq格式,但是fasta和...

  • 数据格式

    1. fasta和fastq 1.1. fasta:序列 以 > 开头 gi|gi号|来源标识|序列标识(接收号/...

  • 转录组分析(一)数据前处理

    一、FASTA和FASTQ 1. FASTA FASTA文件主要由两个部分构成:序列头信息(有时包括一些其它的描述...

  • FASTA和FASTQ 介绍

    参考: 从零开始完整学习全基因组测序数据分析:第2节 FASTA和FASTQ作者:碱基矿工 前言 在生物信息分析过...

  • seqkit-【处理fasta/q 序列之父】

    之间处理fasta或者fastq时总是自己进行写脚本,比如:fasta-fastaq的转化,根据名称调取fasta...

  • NGS009 生信常用数据格式

    Fasta & Fastq Fastaa也即alignment,Fasta格式也称为Pearson格式,是一种基于...

网友评论

      本文标题:2018-04-10---关于FastQ和FastA(转载)

      本文链接:https://www.haomeiwen.com/subject/eojohftx.html