收获:(这里要敲黑板划重点)
批量处理
脚本的编写
挂后台处理
(网不好真的很难过,很难过,很难过)
miniconda已经安装
- 加速下载先装个:asper
#下载
wget -c https://download.asperasoft.com/download/sw/connect/3.8.1/ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.tar.gz
#解压
tar zxvf ibm-aspera-connect-3.7.4.147727-linux-64.tar.gz
bash ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.sh
cd ~#回到家目录
ls -a#查看所有文件
cd .aspera/
cd connect/
cd bin/
ascp --help#调用成功表明安装成功
pwd#得到路径
#添加环境变量
export PATH="/home/vip11/.aspera/connect/bin:$PATH"
aspera安装成功
- 批量下载(耗时)
cd project
mkdir rna
mkdir sra_data fq_data
cd sra_data
cat >sra.sh #新建脚本
cat SRR_Acc_List.txt |while read id;do (prefetch ${id});done #批量下载数据
cat sra.sh #查看脚本内容
nohup bash sra.sh & #后台运行
cat nohup.out #L查看 nohup.out
下载得到的sra数据
-
批量转化为fastq格式(极耗时,看下图时间戳)
当前的路径为:/home/vip11/project/rna/sra_data
cat >qc.sh #新建脚本
vim qc.sh
ls *sra|while read id;do fastq-dump --gzip --split-3 -O /home/vip11/project/rna/raw_data/ $id 1>/home/vip11/project/rna/raw_data/${id}.log 2>&1;done
# `ls *`当前路径下所有*sra结尾的文件,
# `do fastq-dump --gzip --split-3`格式转换
#`-O /home/vip11/project/rna/raw_data/` 将文件保存在此路径下
#`1>/home/vip11/project/rna/raw_data/${id}.log 2>&1` 文件日志保存在此路径下
nohup bash sra.sh & #运行脚本
sra转fastq
网友评论