美文网首页三代测序相关转录组数据分析
Iso-Seq3|三代全长转录组分析

Iso-Seq3|三代全长转录组分析

作者: 维凡生物 | 来源:发表于2022-01-07 08:51 被阅读0次

    Iso-Seq 3

    大家都知道全长转录组(Full-length transcriptome)是基于PacBio和Nanopore三代测序平台,它的优势在于无需打断拼接,直接获得包含5’UTR、3’UTR、polyA尾的mRNA全长序列及完整结构信息,有利于解决二代转录本重构准确率低的问题,从而准确分析有参考基因组物种可变剪接及融合基因等结构信息,克服无参考基因组物种转录本拼接较短、信息不完整的难题。同时还可以借助二代测序数据,进行转录本特异性表达分析,获得更加全面的注释信息。

    Iso-Seq3是最新的三代全长转录组分析软件,它包含用于识别PacBio单分子测序数据中的转录本的最新工具。

    Iso-seq 3使用方法如下:

    1 ccs(Circular Consensus Calling)
    ccs 获取一致性的序列,要求每一条测序的reads至少有一端含有引物序列。

    ccs test.subreads.bam ccs.bam  --noPolish --minPasses 1
    

    2 测序引物和barcode的去除
    这一步是采用lima 来完成的,这个软件也是官方最新开发出来的程序,速度和准确度都较以往的算法有了很大的提升。还能够基于barcode序列区分不同的样品,

    lima ccs.bam barcoded_primers.fasta  demux.ccs.bam --isoseq --no-pbi
    

    3 聚类(cluster)
    聚类采用IsoSeq3 软件来完成,这一步会首先将ployA尾巴去除掉,并将连环结构去除掉,再对相似的序列进行聚类,最好形成全长的reads。

    isoseq3 cluster demux.primer_5p--primer_3p.bam  unpolished.bam --verbose
    

    4 抛光(polish)
    这一步主要是将聚类的转录本,合并成一个完整的一致性序列。

    isoseq3 polish -j 16 unpolished.bam  test.subreads.bam   polished.bam
    

    END

    图图云平台-永久免费绘图工具
    https://www.cloudtutu.com/

    image.png

    相关文章

      网友评论

        本文标题:Iso-Seq3|三代全长转录组分析

        本文链接:https://www.haomeiwen.com/subject/afxjcrtx.html