2020.3.26
在新的虚拟机里安RNA-seq所需的软件
参考这篇
💥💥💥我觉得学RNA-seq必看的文献!!💥💥💥
这篇写的特别好:RNAseq-workflow
RNA-seq流程
RNA-seq一般流程
本科生搞定RNA-seq上游数据分析
所需要的软件
-数据下载:sra-tools
-质控:fastqc,multiqc;trimmomatic,trim-galore,cutadapt
-比对:hisat2,bowtie2,tophat,bwa,subread
-计数:htseq, bedtools ,deeptools salmon
开始安装conda
下载conda
linux 64位
wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
777
是指r
w
t
421权限都给
chmod 777 Miniconda3-latest-Linux-x86_64.sh
运行
bash Miniconda3-latest-Linux-x86_64.sh
一路yes
但是是否安在PATH中 选no
!!!
输入conda
发现找不到 这时
cd ./miniconda3/bin
发现有activate
文件 但还是需要给它权限
chmod 777 activate
启动conda
第一个.
等于 source
. ./activate
出现(base)
表示启动成功,可以输入 conda list
测试一下
添加频道 这两个是官方的
conda config --add channels bioconda
conda config --add channels conda-forge
这个是别人推荐的
conda config --add channels genomedk
查看已添加的频道
vim ~/.condarc
conda config --get channels
退出vim
:wq!
安装 gatk
conda install gatk
退出 conda
第一个.
等于 source
. ./deactivate
以上差不多conda
就安好了
新建环境
, python
版本为2.7, -n
: 设置新的环境的名字
conda create -n RNA-seq python=2.7
环境启动语句
进入环境
conda activate RNA-seq
安装软件
conda install -y fastqc
conda install -y sra-tools
conda install -y trim-galore
conda install -y star
conda install -y hisat2
conda install -y bowtie2
conda install -y subread
conda install -y htseq
conda install -y cutadapt
conda install -y multiqc
conda install -y samtools
查看已安装软件
conda list
软件名 --help
下载SRA
格式文件
在GEO数据库中搜索GSE号,然后点击↓
选好需要的数据后可以:
①一个一个下,
②在前面□里打钩,然后选择↓,会得到一个SRR_Acc_List.txt文件
2020.3.26 一个插曲
下载SRA数据时报错:No Space Left
然后我用 df -h
, df -i
查看了一下使用情况,发现df -h
后使用率100%,但是df -i
后使用率只有31%
然后又按照网上大家的一些建议删除了小文件和工作日志,还是没有腾出空间。
这里附上链接:
"No space left on device”错误的排查与解决方法
解决Linux系统磁盘空间满的办法
然后pl建议我扩容硬盘,我就又搜索了一些怎么扩容硬盘的教程
这里附上链接:
VirtualBox 扩展虚拟硬盘容量
但是我实在是太菜了,看到后面还要分区,我觉得我实在操作不了,遂放弃🤦♀️
所以菜鸡如我只好重新建个虚拟机了
使用软件:VirtualBox
、XShell
、Notepad++
2020.3.27 第二天
cd
路径到RNA-seq
目录里,在SRA
上下载txt
文件,放到RNA-seq
目录里
这个文件的内容其实就是它们的“名字”
sra文件
txt
文件作为while read
的输入
先cd 到要储存 sra 格式的文件夹里,我的SRR_Acc_List.txt也存在这里
nohup cat SRR_Acc_List.txt | while read num;do (prefetch $num); done &
为了后续操作的方便,我会把.sra
格式全部移到一个新的文件夹里,详见RNA-seq摸索:2.sra下载数据→fastqc质控→hisat2/bowtie2/STAR/salmon比对→Samtools格式转换→IGV可视化结果
网友评论