python提取fasta fastq文件信息

作者: 11的雾 | 来源:发表于2018-12-27 14:27 被阅读1次

python提取fasta fastq文件信息
根据seqid提取fastq序列
转录组分析（一）数据前处理
linux学习
SeqFu
生物信息分析常用文件格式和软件
「数据整理」处理fasta文件的简单命令
测序信息处理可视化
fasta文处理
2019-05-04

1. Fastq

从fastq中提取出指定的序列，已知某一个read id，就可以提取fastq序列，如下为一个test.fq文件

@M04261:27:000000000-C7J75:1:1101:11401:1775 1:N:0:TCGCCTTA
ATCCTGACCCTGCGTACCAGCACAGGTTTGCACAAAAAAGCAGGCTACCATGCTGAGTCTTCTGCTCCTTCTCCTGGGACTAGCCAAGCAGGGATAT
+
CCCCCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGG
@M04261:27:000000000-C7J75:1:1101:12584:1776 1:N:0:TCGCCTTA
ATCCTGGACCGATGTGGAGGAAAATCCTGGACCCTGCGTACCAGCACAAGTTTGTACAAAAAAGCAGGCTACCATGGACTCCTGGACCCTCTGCTGT
+
CCCCCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGG

python extract.FastX.py  test.fq M04261:27:000000000-C7J75:1:1101:12584:1776

屏幕输出fastq信息。

如果你已知的read id是一个文件，包含了许多read id，也是可以的。

python extract.FastX.py  test.fq read_id.list

2. Fasta：

已知fasta文件，你想提取出fasta文件中第几条染色体的序列，或者第几条染色体上具体某段区域的序列。可以如下操作
假设你的fasta文件是这样的：test.fa

>chr1
ATCGATCGATCG

提取操作：

python extract.FastX.py test.fast chr1 2 4
直接屏幕输出
TCG
如果想看整条chr1的信息：

python extract.FastX.py test.fast chr1
直接屏幕输出
ATCGATCGATCG

此脚本支持压缩和非压缩的fastq或者fasta文件格式。
脚本地址：https://github.com/levinyi/scripts/

网友评论

生信笔记

本文标题：python提取fasta fastq文件信息

本文链接：https://www.haomeiwen.com/subject/gzmrlqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

python提取fasta fastq文件信息

1. Fastq

2. Fasta：

相关文章

python提取fasta fastq文件信息

根据seqid提取fastq序列

转录组分析（一）数据前处理

linux学习

SeqFu

生物信息分析常用文件格式和软件

「数据整理」处理fasta文件的简单命令

测序信息处理可视化

fasta文处理

2019-05-04

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

生信笔记