美文网首页
readseq处理序列文件

readseq处理序列文件

作者: 热爱大自然的小和尚 | 来源:发表于2018-01-25 16:30 被阅读0次

Genbank文件包含一条序列数据的多方面信息,但却不是分析时可以直接利用的有效格式,因此,多数时候,我们需要在分析之前对Genbank格式进行转换。于是,就有了readseq(我开个玩笑)

我打算慢慢写这个工具的使用笔记,用一点,写一点
当然,大家可以直接上readseq的官网看使用说明

安装

brew install readseq简单粗暴

使用

  • 引用自biostar handbook
  • 在Unix类型系统下,我们可以使用管道pipe直接接收来自cat等的数据,加上-p参数即可
  • 默认传入的序列格式为.gb

让我们先下载一段序列:efetch -format=gb -db=nuccore -id=AF086833 > AF086833.gb

  1. 将数据格式转换为fasta:cat AF086833.gb | readseq -p -format=FASTA
  2. 转换格式的同时提取CDS区:cat AF086833.gb | readseq -p -format=FASTA -feat=CDS
  3. 转换为GFF格式:cat AF086833.gb | readseq -p -format=GFF
  4. 转换为GFF的同时提取CDS区:cat AF086833.gb | readseq -p -format=GFF -feat=CDS

提示:readseq在提取数据时,如果gb文件包含蛋白质序列,那么在annotation部分,你还可以直接得到蛋白质序列,很棒啊!

相关文章

  • readseq处理序列文件

    Genbank文件包含一条序列数据的多方面信息,但却不是分析时可以直接利用的有效格式,因此,多数时候,我们需要在分...

  • FastA多序列处理工具

    以前处理fasta文件都是使用的python,因为有强大的Biopython。现在发现R也有很多包可以处理序列文件...

  • python处理fasta文件序列

    1.获取给定DNA序列的反向互补序列: 思路:从一个文件中导入序列,然后将互补后的结果输出到另外一个文件中。先定义...

  • python处理fastq文件序列

    1.序列长度分布统计 2.FASTQ转换成FASTA 3.统计各种碱基个数及GC%

  • 9-【seqkit】的安装和使用(2021.2.19更新)

    安装时间:2021.2.16 1. 简介 seqkit是一套针对fasta/fastq序列文件进行各种处理的文件,...

  • Uniprot整合数据比对分析

    1.从uniprot上下载蛋白序列以及带有物种分类的excel文件 首先对excel文件进行处理:将文件变为以下形...

  • AFN 基本使用

    GET&POST 请求 文件下载 文件上传 序列化处理 监听网络状态 GET 方式发送请求 POST方式发送请求 ...

  • python医学影像2Ddicom文件转成3Dnii文件(保留原

    最近处理医院影像数据时,遇到的需求:把预处理后的MRI影像的每个序列的所有dicom文件保存成nii文件,并且要保...

  • 2021-03-07

    测序fa文件里的序列: sam文件里的序列: sam序列=reference文件序列,不管正负,都是一个顺序的序列...

  • 多线程网络07

    1 AFN基本使用(GET和POST) 2 AFN实现文件下载 3 AFN实现文件上传 5 AFN序列化相关处理 ...

网友评论

      本文标题:readseq处理序列文件

      本文链接:https://www.haomeiwen.com/subject/ptwvaxtx.html