美文网首页走进转录组
转录组数据的比对和定量

转录组数据的比对和定量

作者: 谢京合_数据分析人 | 来源:发表于2021-02-06 10:21 被阅读0次

最近疲于整文章,写本子,所以很久木有跟新啦。
今天终于可以整理一下先前的工作啦~~
一、转录组定量
转录组定量的软件有太多了,网上一搜一大堆。但是,原理原理大同小异,选一个你自己趁手的就行。
我这里就选择:Hisat2——samtools——featureCounts——DEseq2/edgeR
1、Hisat2比对
1.1、安装
去官网(http://daehwankimlab.github.io/hisat2/)下载。
按照readme文件装在服务器上即可。
1.2、比对
需要参考基因组文件和fastQ文件。
人的参考基因组文件,Hisat2官网上有直达的链接。(真是方面,用户体验满分)
然后就是自己的测序文件。

hisat2 -q -x ../reference/hg38 -1 ../rawdata/control-2_1.clean.fq.gz -2 ../rawdata/control-2__2.clean.fq.gz -S control-2.sam

最后的-S后面是输出文件,是sam格式。

2、samtools格式转换
刚才得到的sam文件需要一系列转化,换成featureCounts可识别的bam文件。
具体脚本如下:

samtools view -bS control-2.sam > control-2.bam
samtools sort control-2.bam -o control-2.sorted.bam

提示,
在上述步骤的时候要格外注意服务区的线程数和内存。
我发现了很多次,在转换的时候如果任务太多,会被挤掉。

3、featureCounts定量
这里就是需要把所有样本的每个基因进行定量。
需要提前准备人的基因组注释文件genes.gtf
这个Hisat2官网上貌似也有。
命令:

featureCounts -p -t exon -g gene_id -a ../reference/genes.gtf -o counts.txt control-2.sorted.bam control-3.sorted.bam

-o后面 是输出文件
最后是所有的样本的bam文件。

我这里只记录集体的操作方法,不会写具体的原理。
原理你们自己去google(百度)都行。
哈哈,实在是不想写那么多字。

相关文章

  • 转录组数据的比对和定量

    最近疲于整文章,写本子,所以很久木有跟新啦。今天终于可以整理一下先前的工作啦~~一、转录组定量转录组定量的软件有太...

  • shiny CountToTPM/FPKM

    定量 转录组数据分析上游分析的最后步骤就是对比对的bam文件进行定量,用的比较多的是HTseq和Subread软件...

  • 转录组测序1-测序原始数据说明

    转录组测序是最常用的组学实验,对全谱基因定量,找到差异表达基因。RNAseq涉及到原始数据,数据质控,基因组比对,...

  • 转录组测序2-测序数据质控

    转录组测序是最常用的组学实验,对全谱基因定量,找到差异表达基因。RNAseq涉及到原始数据,数据质控,基因组比对,...

  • 转录组测序3-序列基因组比对

    转录组测序是最常用的组学实验,对全谱基因定量,找到差异表达基因。RNAseq涉及到原始数据,数据质控,基因组比对,...

  • 转录组测序6-基因GO、KEGG、GSEA富集

    转录组测序是最常用的组学实验,对全谱基因定量,找到差异表达基因。RNAseq涉及到原始数据,数据质控,基因组比对,...

  • 转录组测序5-基因差异表达分析

    转录组测序是最常用的组学实验,对全谱基因定量,找到差异表达基因。RNAseq涉及到原始数据,数据质控,基因组比对,...

  • 用简单的EM算法模型理解RSEM算法

    问题的描述 RSEM 是典型的基于转录本定量的方法,它的比对需要下载参考转录本的fa序列,与基因组比对不同,转录本...

  • 转录组表达定量- Read count?CPM? RPKM? F

    转录组表达定量- Read count?CPM? RPKM? FPKM? 1.Read count 数值概念:比对...

  • 快速计算基因表达软件:Salmon

    我们常见的转录组表达分析一般都是将reads比对至参考基因组或者转录组上,然后在基因或者转录本水平上定量表达丰度。...

网友评论

    本文标题:转录组数据的比对和定量

    本文链接:https://www.haomeiwen.com/subject/rhgntltx.html