1.后台命令
nohup和&
nohup该命令可以在你退出帐户/关闭终端之后继续运行相应的进程,就是不挂起的意思( no hang up)
&命令在后台运行,即结果不输出到屏幕,并非是提交到服务器
nohup STAR --runThreadN 3 --runMode genomeGenerate --genomeDir ~/mouse/reference/index/mm10/ --genomeFastaFiles ~/mouse/reference/GRCm38.p6.genome.fa --sjdbGTFfile ~/mouse/annotation/gencode.vM20.annotation.gtf --sjdbOverhang 100 &
2.查看某个用户正在运行的任务
ps -u xjqi
3.读取压缩包中文件
image.png压缩包来自GEO数据,有些情况下载GSExxx后,是没有表达矩阵的:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE126789
- 在R里层级读取文件也是可以的,我这边在Linux中处理了一下,很方便;
- 下载了压缩包之后传输到服务器;
也不知道是不是多此一举???
image.png
####创建文件夹进行操作
mkdir GSE126789_RAW
####进行解压缩,可根据自己的文件进行相应解压命令的修改
for tar in *.tar; do tar xvf $tar; done
解压前
解压后
列出所有的GSM文件,方便之后进行循环读取
ll|grep 'GSM'|cut -d ' ' -f 10 ->file.txt
file.txt
循环读取文件,得到目的的列
####echo 文件名重定向至文件(防止将样品和counts搞乱),后将对应的counts追加至文件
cat > read.bash
cat $1|while read line
do
echo $line > $line.txt
zcat $line|cut -f 1,7 >> $line.txt
done
###CTRL+C终止
bash read.bash file.txt
####paste即可将文件以列进行合并了
paste GSM*.gz.txt > total.txt
网友评论