看老大RNA-seq视频
P5/P6:RNA-seq:软件安装-上/下
1.有源代码的下载源代码,一般的软件会提供多个平台
2.没有源代码的下载二进制版本
linux的软件中心---conda---类似360软件中心
$():把括号里的命令运行一下
安装完conda后,最重要的一步是添加清华源的镜像,提高下载速度,配置环境需要用到conda config。可用conda config --show查看已有的配置
查看已有环境
conda info --envs
建立一个python2环境,并且安装比对软件bwa
conda create -n biostar python=2 bwa
Create -n rna python=2 bwa

点yes后会将添加到环境变量

如果没添加到环境变量,单次install的时候就是miniconda3/bin/conda create -n biostar python=2 bwa

如果添加到环境变量,就是conda create -n biostar python=2 bwa
用conda安装前可先conda search trimmomatic,看看这个软件是不是conda给他的名字
也可在下面这个网址搜索bioconda是否有这个包(看看大小写、下划线、中华线之类的)
conda不是万能的

删掉conda:rm -rf miniconda3/
cat ~/.barch
export PATH=/home/jmzeng/biosoft/myBIn/bin:$PATH#在变量里加入了👆



P7:5-sratoolkit下载数据
一个RNA-seq实战-超级简单-2小时搞定
第一步:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE50177(在这里更改GSE号)
第二步:
第三步:


cat id |while read id ;do (prefetch $id &) ;done #写一个循环下载fa数据


批量杀任务

生成SRA文件
image-20181229165239017
生成fq文件

批量生产fq文件
ls /public/project/RNA/airway/sra/*sra |while read id;do ( nohup fastq-dump --gzip --split-3 -O ./ $id & );done
寻找gz结尾文件:
find ~/ -name "*gz"
一件我理解不了的了事

可是我 find以后,咩有
而我find其他就有,证明find没用错呀,可能是没有下载下来


不知道为什么不能fastq-dump,链过来的也应该能用的啊,我删掉这个sra的路径再链一次,蓝色和红色什么区别呢?


我想起来了,红色是无效的链接,如果红色是tt从zy那链接 过来的,如果zy给移动或者删除了,那么就失效了,应该是这样的,那条tt和zy是一个从前下,一个从后下的,而我去zy里也找不到SRA文件了。
P8:6-qc
接下来要从fa转fq文件
ls -lh raw/|wc #看数据
less raw/nohup.out #有后台日志
grep failed raw/nohup.out

zless SRR1039508_1.fastq.gz #查看
非常长,要用报告来看,如何做报告,如下:
P10:7-alignment-1
[图片上传失败...(image-d7e79b-1546091661334)]
从老大视频里扒来的链接,先收藏
vi tmp.sh
p12:RNA-seq:7-alignment-3
cat *|awk '{print $1}' |paste - - - - - - - - - - - - - -
linux文本处理3架马车
less -S 文本名 整行显示
Less -SN 文本名
grep RNA SraRunTable.txt |wc
head SRR_Acc_List.txt > id > cat id
mv SraRunTable.txt info改名为info
mv SRR_Acc_List.txt allid改名为allid
grep SRR5933809 info
可以直接grep SRR59338 id,输出来的结果为
SRR5933808
SRR5933809
SRR5933810
SRR5933811
网友评论