美文网首页NGS测序笔记
RNAseq001 转录组入门(1) :资源准备

RNAseq001 转录组入门(1) :资源准备

作者: caoqiansheng | 来源:发表于2020-08-25 14:26 被阅读0次

    主要参考生信技能树RNA-seq基础入门

    http://www.biotrainee.com/thread-1750-1-1.html

    1. 系统准备

    Win10自带Ubuntu子系统,开启详见:
    Linux001 win10 linux子系统安装
    Linux010 Miniconda安装及使用

    2. 安装前准备

    在安装转录组相关软件之前,我们需要新建一个虚拟环境,因转录组某些软件对Python版本有要求,如tophat要求Python=2.7,下面会有涉及到
    另外因为尝试了多次,在安装多个软件的过程中,需要某些软件的安装会升级python,造成依赖于指定python版本的安装包不可用,因此在安装的时候,需要仔细核查
    Linux018 conda虚拟环境

    3. 软件安装

    RNA-seq 基本分析流程

    3.1 sratoolkit

    https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software

    Linux011 Sra toolkit安装及使用
    linux025 SRA数据下载工具ascp的安装及使用

    3.2 数据质控 fastqc

    安装过程中,确认Python版本号为2.7
    http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
    Linux012 Fastqc安装及使用

    3.3 质控数据整合 multiqc

    https://pypi.org/project/multiqc/

    # 我也不确定这么做能不能指定multiqc为python2.7构建,但是确实安装成功了
    conda install  multiqc 
    multiqc --help
    

    3.4 hisat2

    https://daehwankimlab.github.io/hisat2/

    conda install hisat2 
    

    3.5 samtools

    http://www.htslib.org/

    conda install samtools 
    samtools
    

    如果有报错,请参考linux023 conda安装常用生信软件

    3.6 tophat

    tophat安装过程我折腾了很久,主要是一开始不了解软件的要求,建议在安装软件之前,最好是在bioconda主页https://bioconda.github.io/index.html检索是否有该安装包,另外需要确认软件的安装要求。

    我们在bioconda检索tophat,可以看到tophat要求的Python环境为2.7,这就是我们为什么在开始装软件之前要配置Python=2.7的虚拟环境的原因
    http://bioconda.github.io/recipes/tophat/README.html#package-tophat

    image.png
    # 首先新建一个Python2.7版本的虚拟环境,如不指定Python版本号,则默认安装当下最新版本
    # 如果指定Python=2.7,则安装软件过程中,会自动检索该环境下最新版本的软件
    conda create -n rna python=2.7
    # 如不在指定Python版本进行安装,会报错failed with initial frozen solve. Retrying with flexible solve
    conda install tophat 
    tophat
    

    3.7 htseq

    conda install htseq 
    # 查看是否安装成功
    htseq-count
    

    相关文章

      网友评论

        本文标题:RNAseq001 转录组入门(1) :资源准备

        本文链接:https://www.haomeiwen.com/subject/lczajktx.html