具体的介绍和使用方法及原理:使用rmats进行可变剪切的分析(摘自生信修炼手册)
原理:我理解的原理是他利用了3-4个外显子,检测哪个是exon inclusion isoform,哪个是exon skipping isoform,定量一下剪切百分率(PSI),比较两个样本的PSI的差是不是大于自己设定的阈值(这一点不理解,是哪两个isoform之间的对比,为什么是两个样本里的,不应该是对应的exon inclusion isoform和exon skipping isoform之间的对比吗?)
软件用法示例:
1.数据下载:https://sourceforge.net/projects/rnaseq-mats/files/latest/download
gtf文件:Homo_sapiens.Ensembl.GRCh37.75.gtf
2.应该安装python2.7.x版本
3.基本用法:1)先判断用哪个版本的python解释程序
出现1114111说明用rMATS-turbo-Linux-UCS4
出现65535说明用rMATS-turbo-Linux-UCS2
用bam文件:python rMATS-turbo-xxx-UCSx/rmats.py --b1 b1.txt --b2 b2.txt -gtf gtf/Homo_sapiens.Ensembl.GRCh37.75.gtf -od bam_test -t paired --readLength 50 --cstat 0.0001 --libType fr-unstranded
特别注意:b1.txt和b2.txt保存的是每个样本比对参考基因组的bam文件的路径,每个里面可以包含多个bam文件示例如下
具体参数意义:
遇到的问题:结果输出文件只有表头,没有内容,不知道怎么解决
网友评论