美文网首页linux
阿里云国外服务器处理转录组数据RNA-seq

阿里云国外服务器处理转录组数据RNA-seq

作者: 好风凭借力 | 来源:发表于2020-07-26 13:43 被阅读0次

    #美国弗吉尼亚

    8核64G,高主频型

    4.5rmb/h

    新建用户

    adduser wuxiaobin

    passwd wuxiaobin

    赋予root权限:usermod -g root wuxiaobin

    修改/etc/sudoers 文件 重启

    准备工作

    #安装RSEM

    wget -c https://github.com/deweylab/RSEM/archive/v1.3.1.tar.gz

    tar -xzvf ..

    #安装相应配件

    sudo yum install gcc-c++

    sudo yum install zlib zlib-devel

    #安装 R...

    sudo yum install epel-release

    dnf install 'dnf-command(config-manager)'

    dnf config-manager --set-enabled PowerTools

    dnf install R

    #安装perl

    dnf install perl

    dnf install perl-Env

    make 

    make install DESTDIR=/home/my_name

    #安装STAR

    wget https://github.com/alexdobin/STAR/archive/2.7.3a.tar.gz

    tar -xzvf 

    #进入bin目录检查

    #添加环境变量

    export PATH=/home/wuxiaobin/STAR-2.7.3a/bin/Linux_x86_64:$PATH

    export PATH=/home/wuxiaobin/RSEM-1.3.3:$PATH

    第一步:fastq文件下载

    安装sratoolkit(https://www.jianshu.com/p/26f6083f0e7f

    wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-centos_linux64.tar.gz

    1.下载安装压缩包,解压

    tar -xzvf ./

    2.进入bin目录

    ./vdb-config --interactive

    进入图形化界面后按x退出完成激活

    下载:

    nohup prefetch --option-file ./gse.txt &

    #转换为fastq

    nohup fastq-dump SRR2061752.sra &

    or 双端

    nohup fastq-dump --split-filesSRR2061752.sra &(split-file,spilt-e,split-3)

    第二步:去除低质量reads和去接头

    安装fastp

    wget http://opengene.org/fastp/fastp

    双端(3 min)双端数据全部先质控 在进行比对!

    nohup ~/fastp -i ~/c_0_1.fastq -o ./test_1.fastq -I ~/c_0_2_clipper.fastq -O ./test_2.fastq -Q --thread=8 &

    单端(2 min)

    ~/fastp -i ./SRR7912011.fastq -o ./qc.fastq -Q thread=8 -q 20 -u 20 -3 -W 4 -M 20

    第四步:比对回帖

    star和rsem的下载安装

    建立索引(鼠和人)40min

    wget ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_mouse/release_M24/gencode.vM24.annotation.gtf.gz

    wget ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_mouse/release_M24/GRCm38.primary_assembly.genome.fa.gz

    建立索引

    /home/wuxiaobin/RSEM/bin/rsem-prepare-reference -gtf ~/gene_annotation/gencode.vM24.annotation.gtf --star -p 8 ~/gene_annotation/GRCm38.primary_assembly.genome.fa ~/second_object/mus_ref/mus_gencode

    nohup /home/wuxiaobin/RSEM/bin/rsem-prepare-reference -gtf ~/gene_annotation/gencode.v31.annotation.gtf --star -p 8 ~/gene_annotation/GRCh38.primary_assembly.genome.fa ~/human_ref/human_gencode &

    计算表达量

    SE data:

    nohup rsem-calculate-expression --star -p 8 --no-bam-output ./qc.fastq ~/ref/mus_ref/mus_gencode ./mus38_gencode &

    PE data:

    ~/RSEM/bin/rsem-calculate-expression --paired-end --star -p 8 --no-bam-output ~/test/test_1.fastq ~/test/test_2.fastq ~/human_ref/human_gencode ~/test/pe/human38_gencode

    相关文章

      网友评论

        本文标题:阿里云国外服务器处理转录组数据RNA-seq

        本文链接:https://www.haomeiwen.com/subject/aupwlktx.html