美文网首页
【RNA-Seq 实战】一、数据处理流程

【RNA-Seq 实战】一、数据处理流程

作者: 佳奥 | 来源:发表于2022-07-25 15:50 被阅读0次

这里是佳奥,终于来到了转录组分析部分,让我们开始吧!

1 数据资源下载,参考基因组及参考转录组

gtf

genome.fa

1.1 确定项目物种

NCBI UCSC Ensembol :三个数据库的ftp服务器

Google搜索: hg38 ftp ucsc

参考基因组网站:


image.png

我选择基因组最小之一的肠杆菌Ciona intestinalis genome


image.png
其中ci3.fa.gz就是我们的目标文件。
   Name                      Last modified      Size  Description      Parent Directory                               -   
      ci3.2bit                  2015-08-06 10:52   34M  
      ci3.agp.gz                2016-01-08 15:13  145K  
      ci3.chrom.sizes           2015-08-06 09:54   33K  
      ci3.chromAlias.txt        2020-09-29 10:48   58K  
      ci3.fa.gz                 2016-01-08 15:13   36M  
      ci3.fa.masked.gz          2016-01-08 15:13   27M  
      ci3.fa.out.gz             2016-01-08 15:13  3.7M  
      ci3.gc5Base.wib           2019-01-17 14:45   22M  
      ci3.gc5Base.wig.gz        2019-01-17 14:45  452K  
      ci3.gc5Base.wigVarStep.gz 2015-08-06 09:56   56M  
      ci3.trf.bed.gz            2016-01-08 15:13   69K  
      est.fa.gz                 2017-05-05 15:32  250M  
      est.fa.gz.md5             2017-05-05 15:32   44   
      genes/                    2020-10-02 13:37    -   
      md5sum.txt                2019-01-17 15:52  652   
      mrna.fa.gz                2017-05-05 13:59  4.6M  
      mrna.fa.gz.md5            2017-05-05 13:59   45   
      refMrna.fa.gz             2017-05-05 15:34  713K  
      refMrna.fa.gz.md5         2017-05-05 15:34   48   
      upstream1000.fa.gz        2016-01-08 15:14  249K  
      upstream2000.fa.gz        2016-01-08 15:14  474K  
      upstream5000.fa.gz        2016-01-08 15:14  1.1M  
      xenoRefMrna.fa.gz         2017-05-05 15:33  298M  
      xenoRefMrna.fa.gz.md5     2017-05-05 15:33   52   

当然看个人习惯,可以直接

wget https://hgdownload.soe.ucsc.edu/goldenPath/ci3/bigZips/ci3.fa.gz

或者在Windows下载后把压缩包上传至Linux(一般这样更快)。

在这之前在Linux新建reference/ci3目录。

看一下下载好的文件:

$ gzip -d ci3.fa.gz
$ less -S ci3.fa
>chr1
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
aaCCCCTAACTGCTAGCCCCTGCCCCcgtaaccaccaacctctaacactt
tccaccagcccaatctgtaacgtaccaagggattcttcactagtgccacA
GTTTCTAATacagaataaacaaaattcacTTAACTTGACCAAACAATATT
CTGCTTTCAACATTATAGAACAACCTACTcactataaaaaaacacatggc
gcctgaaaaatatgtttataaaaacaatatacttATTTCGTatcaaaaac
attcaaaacatATCAATTCAAAACGCAGGCTTTACTAAACTCATTACAAA
ATGCGGCAAATTCAAAGTGAAGAGGTATAGTACCTCGTCTAATCGTTTTA
ATACCTAAAACTTACATACGAAATGAGTATTACCACTTAGCCACTCAAAG
CAAATTGAAATGCGCGCGGCTCGAACCTCAATGGGGTCACGTGACAGGTC
GCGGTCGGCCGATCACGAACAACAGCTGTCGAGAATCGTTTACTACGAAG
CTAAGGGACGTGTCTACTCTGTAGCATTGGGCAGATGCCGTTAGGAAAGT

2 质控,需要fastqc及multiqc

trimmomatic

cutadapt

trim_galore

3 比对

star

hisat2

tophat2

bowtie2

bwa

subread

4 计数

htseq

bedtools

deeptools

5 normalization 归一化,差异分析等

DEseq2

edgeR

limma()

6 小结

这一篇我们梳理了大致的流程,寻找研究对象的参考基因组并下载。

下一篇我们将进入软件安装的内容。

我们下一篇再见!

相关文章

  • 【RNA-Seq 实战】一、数据处理流程

    这里是佳奥,终于来到了转录组分析部分,让我们开始吧! 1 数据资源下载,参考基因组及参考转录组 gtf genom...

  • RNA-seq前期数据分析

    自己在学习数据处理时候的笔记,希望能帮到大家~RNA-seq数据基本分析流程: 参考文献:https://www....

  • RNA-seq实战分析流程

    一、下载测序数据 ①SRA数据库[存储二代测序的原始数据]②在进行上游分析时,数据格式转换过程概述如下:sra↓F...

  • 大数据学习路线

    一、大数据处理流程 上图是一个简化的大数据处理流程图,大数据处理的主要流程包括数据收集、数据存储、数据处理、数据应...

  • 链特异性建库测序原理

    RNA-seq基本流程 下图是一个大概的RNA-seq基本流程 [图片上传失败...(image-8ca9c-15...

  • 无标题文章

    DataEngine数据处理流程 DataEngine数据处理流程包含如下步骤: changevalidatepu...

  • RNA-seq 数据分析最佳实战(综述)

    一篇RNA-seq分析流程的综述,全面而详细!深度好文,可用来反复阅读。初学者用于把握RNA-seq真个流程及各个...

  • 1.Empirical assessment of analys

    RNA-seq分析流程分析:RNA-seq数据分析流程主要由序列对比,表达矩阵构建,差异基因鉴定等三大步骤构成【1...

  • BSR-(RNA-seq)数据进行BSR分析-更新中

    使用工具GATK4。GATK基础RNA-seq分析GATK官方RNA-seq calling流程WT 3个单株,混...

  • Note1_批量化RNA-seq

    建立索引 拆分sra数据 批量压缩文件 rna-seq流程

网友评论

      本文标题:【RNA-Seq 实战】一、数据处理流程

      本文链接:https://www.haomeiwen.com/subject/xfggirtx.html