美文网首页
看老大RNA-seq视频-P5/P6:RNA-seq:4-软件安

看老大RNA-seq视频-P5/P6:RNA-seq:4-软件安

作者: 小梦游仙境 | 来源:发表于2018-12-29 21:55 被阅读24次

    看老大RNA-seq视频

    P5/P6:RNA-seq:软件安装-上/下

    1.有源代码的下载源代码,一般的软件会提供多个平台

    2.没有源代码的下载二进制版本

    linux的软件中心---conda---类似360软件中心

    $():把括号里的命令运行一下

    安装完conda后,最重要的一步是添加清华源的镜像,提高下载速度,配置环境需要用到conda config。可用conda config --show查看已有的配置

    查看已有环境

    conda info --envs

    建立一个python2环境,并且安装比对软件bwa

    conda create -n biostar python=2 bwa

    Create -n rna python=2 bwa

    image-20181229110154604

    点yes后会将添加到环境变量

    image-20181229103047001

    如果没添加到环境变量,单次install的时候就是miniconda3/bin/conda create -n biostar python=2 bwa

    image-20181229103437140

    如果添加到环境变量,就是conda create -n biostar python=2 bwa

    用conda安装前可先conda search trimmomatic,看看这个软件是不是conda给他的名字

    也可在下面这个网址搜索bioconda是否有这个包(看看大小写、下划线、中华线之类的)

    http://bioconda.github.io/recipes.html

    conda不是万能的

    image-20181229114518490

    删掉conda:rm -rf miniconda3/

    cat ~/.barch
    export PATH=/home/jmzeng/biosoft/myBIn/bin:$PATH#在变量里加入了👆
    
    image-20181229115656043 image-20181229115534726 image-20181229120142675

    P7:5-sratoolkit下载数据

    一个RNA-seq实战-超级简单-2小时搞定

    ** http://www.bio-info-trainee.com/2218.html**

    第一步:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE50177(在这里更改GSE号)

    第二步: image-20181229161430724

    第三步:

    image-20181229161537206 第四步: image-20181229161639383
    cat id |while read id ;do (prefetch $id &) ;done #写一个循环下载fa数据
    
    image-20181229160853959 image-20181229160935680

    批量杀任务

    image-20181229164912868

    生成SRA文件

    image-20181229165239017

    生成fq文件

    image-20181229175915292

    批量生产fq文件

    ls /public/project/RNA/airway/sra/*sra |while read id;do ( nohup fastq-dump --gzip --split-3 -O ./ $id & );done
    

    寻找gz结尾文件:
    find ~/ -name "*gz"

    一件我理解不了的了事

    image-20181229190911195

    可是我 find以后,咩有

    而我find其他就有,证明find没用错呀,可能是没有下载下来

    image-20181229191052471 image-20181229202232620

    不知道为什么不能fastq-dump,链过来的也应该能用的啊,我删掉这个sra的路径再链一次,蓝色和红色什么区别呢?

    image-20181229203110033 image-20181229212814230

    我想起来了,红色是无效的链接,如果红色是tt从zy那链接 过来的,如果zy给移动或者删除了,那么就失效了,应该是这样的,那条tt和zy是一个从前下,一个从后下的,而我去zy里也找不到SRA文件了。

    P8:6-qc

    接下来要从fa转fq文件

    ls -lh raw/|wc #看数据
    
    less raw/nohup.out #有后台日志
    
    grep failed raw/nohup.out
    
    image-20181229180750515
    zless SRR1039508_1.fastq.gz #查看
    

    非常长,要用报告来看,如何做报告,如下:

    
    

    P10:7-alignment-1

    [图片上传失败...(image-d7e79b-1546091661334)]

    从老大视频里扒来的链接,先收藏

    https://blog.csdn.net/xubo245/article/details/50878760

    https://blog.csdn.net/xubo245/article/details/50836185

    vi tmp.sh

    p12:RNA-seq:7-alignment-3

    cat *|awk '{print $1}' |paste - - - - - - - - - - - - - -
    

    linux文本处理3架马车

    less -S 文本名 整行显示

    Less -SN 文本名

    grep RNA SraRunTable.txt |wc

    head SRR_Acc_List.txt > id > cat id

    mv SraRunTable.txt info改名为info

    mv SRR_Acc_List.txt allid改名为allid

    grep SRR5933809 info

    可以直接grep SRR59338 id,输出来的结果为

    SRR5933808

    SRR5933809

    SRR5933810

    SRR5933811

    相关文章

      网友评论

          本文标题:看老大RNA-seq视频-P5/P6:RNA-seq:4-软件安

          本文链接:https://www.haomeiwen.com/subject/adqmlqtx.html