美文网首页circRNAceRNA
使用circRNA_finder识别环状RNA

使用circRNA_finder识别环状RNA

作者: 生信修炼手册 | 来源:发表于2019-02-25 13:22 被阅读0次

    欢迎关注”生信修炼手册”!

    circRNA_finder是一款环状RNA预测软件,在对果蝇的研究中采用该软件进行了环状RNA的预测,该软件的源代码托管在github上,网址如下

    https://github.com/orzechoj/circRNA_finder

    软件的安装比较简便,直接下载解压就可以了,需要注意的是,该软件依赖以下几个软件

    1. perl

    2. awk

    3. STAR

    4. samtools

    其中samtools的版本必须是低于1.0的版本,因为两个版本samtools sort的用法有变化。软件的使用包含如下两个步骤

    1. STAR比对参考基因组

    STAR是一款转录组数据的比对软件,其支持嵌合体的比对方式,也就是说支持一条reads的两个部分比对到不同的基因组区域,而环状RNA的junction reads就是符合这样的要求,代码如下

    STAR \
    --genomeDir hg19_star_db/ \
    --readFilesCommand gunzip -c \
    --readFilesIn R1.fastq.gz R2.fastq.gz \
    --runThreadN 4 \
    --chimSegmentMin 20 \
    --chimScoreMin 1 \
    --alignIntronMax 500000 \
    --outFilterMismatchNmax 4 \
    --alignTranscriptsPerReadNmax 100000 \
    --twopassMode Basic \
    --outSAMtype BAM SortedByCoordinate \
    --chimOutType SeparateSAMold \
    --outFilterMultimapNmax 2 \
    --outFileNamePrefix C1

    虽然软件提供了一个名为runStar.pl的脚本,但是由于STAR的版本问题,使用起来并不方便。该脚本本质上是对STAR的封装,直接用STAR就好了,参数设置可以参考脚本中的设置。

    2.  运行circRNA_finder

    第二步就是预测环状RNA,代码如下

    perl \
    postProcessStarAlignment.pl \
    --starDir star_out_dir \
    --minLen 100 
    --outDir output_dir

    运行完成之后,会三个文件,对应的后缀如下所示

    1. _filteredJunctions.bed

    2. _s_filteredJunctions.bed

    3. _s_filteredJunctions_fw.bed

    第一个文件为所有环状RNA的结果文件;第二个文件为剪切位点符合GT-AG剪切信号的环状RNA;第三个文件和第二个文件的环状RNA相同,只不过新增了环状RNA连接点附近的线性RNA平均测序深度信息。通常情况下,我们选择第二个文件的结果作为最终的环状RNA预测结果,该文件内容示意如下

    每一行代表一个环状RNA,第一列代表染色体编号,第二列和第三列分别代表起始和终止位置,第四列代表name,这里用数字编号加上字母s表示,第五列代表环状RNA的junction reads数目,也就是表达量,第六列代表正负链信息。

    ·end·

    —如果喜欢,快分享给你的朋友们吧—

    扫描关注微信号,更多精彩内容等着你!

    相关文章

      网友评论

        本文标题:使用circRNA_finder识别环状RNA

        本文链接:https://www.haomeiwen.com/subject/bwowyqtx.html