1.在任意文件夹下面创建形如 1/2/3/4/5/6/7/8/9 格式的文件夹系列
$ mkdir task
$ cd task
$ mkdir -p 1/2/3/4/5/6/7/8/9
2. 在创建好的文件夹下面,比如我的是 /Users/jimmy/tmp/1/2/3/4/5/6/7/8/9 ,里面创建文本文件 me.txt
$ cd 1/2/3/4/5/6/7/8/9
$ touch me.txt
3.在文本文件 me.txt 里面输入内容:
Go to: http://www.biotrainee.com/
I love bioinfomatics.
And you ?
$ vim me.txt
i
Go to: http://www.biotrainee.com/
I love bioinfomatics.
And you ?
q:wq
$ cat me.txt
4.删除上面创建的文件夹 1/2/3/4/5/6/7/8/9 及文本文件 me.txt
$ cd task/
$ rm -r 1
5.在任意文件夹下面创建 folder1~5这5个文件夹,然后每个文件夹下面继续创建 folder1~5这5个文件夹,效果如下:
$ mkdir -p folder{1..5}/folder{1..5}
6.在第五题创建的每一个文件夹下面都创建第二题文本文件 me.txt ,内容也要一样。
答案1$ echo folder{1..5}/folder{1..5} | xargs -n 1 cp -v me.txt
答案2$ for dirs in folder{1..5}/folder{1..5}; do cp me.txt $dirs; done
答案3$ for a in {1..5};do
cd ~/folder$a
for b in {1..5};do
cd ~/folder$a/folder$b
cp ./me.txt ~/folder$a/folder$b
done
done
不会做,搜到3个答案,学习了循环变量和xargs
7.再次删除掉前面几个步骤建立的文件夹及文件
$ rm -r folder*
8.下载 http://www.biotrainee.com/jmzeng/igv/test.bed 文件,后在里面选择含有 H3K4me3 的那一行是第几行,该文件总共有几行。
$ wget http://www.biotrainee.com/jmzeng/igv/test.bed
$ less -S test.bed|wc -l
$ less -S test.bed |grep -n H3K4me3
9下载 http://www.biotrainee.com/jmzeng/rmDuplicate.zip 文件,并且解压,查看里面的文件夹结构
$ wget http://www.biotrainee.com/jmzeng/rmDuplicate.zip
$ unzip rmDuplicate.zip
$ tree rmDuplicate
10.打开第九题解压的文件,进入 rmDuplicate/samtools/single 文件夹里面,查看后缀为 .sam 的文件,搞清楚生物信息学里面的SAM/BAM 定义是什么。
$ cd rmDuplicate/samtools/single
$ ls *.sam
SAM(Sequence Alignment/Map)格式是一种通用的比对格式,用来存储reads到参考序列的比对信息。
BAM是SAM的二进制格式,因此两者格式相同,只是BAM文件占用储存空间更小,运算更快。
网友评论