美文网首页生信笔记
python提取fasta fastq文件信息

python提取fasta fastq文件信息

作者: 11的雾 | 来源:发表于2018-12-27 14:27 被阅读1次

1. Fastq

从fastq中提取出指定的序列,已知某一个read id,就可以提取fastq序列,如下为一个test.fq文件

@M04261:27:000000000-C7J75:1:1101:11401:1775 1:N:0:TCGCCTTA
ATCCTGACCCTGCGTACCAGCACAGGTTTGCACAAAAAAGCAGGCTACCATGCTGAGTCTTCTGCTCCTTCTCCTGGGACTAGCCAAGCAGGGATAT
+
CCCCCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGG
@M04261:27:000000000-C7J75:1:1101:12584:1776 1:N:0:TCGCCTTA
ATCCTGGACCGATGTGGAGGAAAATCCTGGACCCTGCGTACCAGCACAAGTTTGTACAAAAAAGCAGGCTACCATGGACTCCTGGACCCTCTGCTGT
+
CCCCCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGG
python extract.FastX.py  test.fq M04261:27:000000000-C7J75:1:1101:12584:1776

屏幕输出fastq信息。

如果你已知的read id是一个文件,包含了许多read id,也是可以的。

python extract.FastX.py  test.fq read_id.list

2. Fasta:

已知fasta文件,你想提取出fasta文件中第几条染色体的序列,或者第几条染色体上具体某段区域的序列。可以如下操作
假设你的fasta文件是这样的:test.fa

>chr1
ATCGATCGATCG

提取操作:

python extract.FastX.py test.fast chr1 2 4
直接屏幕输出
TCG
如果想看整条chr1的信息:

python extract.FastX.py test.fast chr1
直接屏幕输出
ATCGATCGATCG

此脚本支持压缩和非压缩的fastq或者fasta文件格式。
脚本地址:https://github.com/levinyi/scripts/

相关文章

  • python提取fasta fastq文件信息

    1. Fastq 从fastq中提取出指定的序列,已知某一个read id,就可以提取fastq序列,如下为一个t...

  • 根据seqid提取fastq序列

    工具:seqtk 从fasta/fastq文件中提取子集 seqtk subseq head40.fq a.lis...

  • 转录组分析(一)数据前处理

    一、FASTA和FASTQ 1. FASTA FASTA文件主要由两个部分构成:序列头信息(有时包括一些其它的描述...

  • linux学习

    批量复制和解压 批量修改后缀名 提取fastq中的fasta序列 diamond结果筛选和去冗余 提取文件某行并统...

  • SeqFu

    SeqFu SeqFu用于处理和解析来自FASTA / FASTQ文件的信息,支持压缩的输入文件。包括用于交错和解...

  • 生物信息分析常用文件格式和软件

    生物信息分析常用文件格式和软件 文件格式 数据格式 fastq fasta 注释 gtf gff bed bcf ...

  • 「数据整理」处理fasta文件的简单命令

    1. 将fasta中的header name替换为对应的fasta文件名 2. 提取fasta文件第一条序列信息 ...

  • 测序信息处理可视化

    数据格式 FASTQ和FASTA:均为文本文件,前者用@标记起始,后者用>标记起始。FASTQ不仅存储质量信息,还...

  • fasta文处理

    fastq 转fasta文件: awk '{if(NR%4 == 1){print ">" substr($0, ...

  • 2019-05-04

    fasta和fastq格式文件的shell小练习 1 统计reads_1.fq 文件中共有多少条序列信息 2 输出...

网友评论

    本文标题:python提取fasta fastq文件信息

    本文链接:https://www.haomeiwen.com/subject/gzmrlqtx.html