1. 压缩文件的分类:
ZIP:扩展名为.zip,用于压缩/解压缩的程序是zip/unzip;
GZIP:扩展名为.gz,用于压缩/解压缩的程序是gzip/gunzip,UNIX系统最常用的压缩文件形式;
BZIP2:扩展名为.bz/.bz2,用于压缩/解压缩的程序是bzip2/bunzip2;
XZ:扩展名为.xz
BGZIP:生信专用的一种压缩文件形式,可以认为是GZIP的变种,BGZIP文件可以用gzip解压,但BGZIP文件只能由bgzip压缩产生。
BGZIP用法示例:
efetch -db=nuccore -format=fasta -id=AF086833 > AF086833.fa
bgzip AF086833.fa
更多的bgzip教程见:http://www.htslib.org/doc/tabix.html
2. 压缩和解压缩:
#下载测序文件:
efetch -db=nuccore -format=fasta -id=AF086833 > AF086833.fa
#用gzip压缩为一个名为AF086833.fa.gz的文件:
gzip AF086833.fa
#预览AF086833.fa.gz:
gzcat AF086833.fa.gz | head
#解压缩AF086833.fa.gz:
gunzip AF086833.fa.gz
3. 压缩多个文件:
#下载测序文件并存储为两个名为AF086833.fa和AF086833.gb的文件:
efetch -db=nuccore -format=fasta -id=AF086833 > AF086833.fa
efetch -db=nuccore -format=gb -id=AF086833 > AF086833.gb
#将AF086833.fa和AF086833.gb压缩为一个名为sequences.tar.gz的文件:
tar czfv sequences.tar.gz AF086833.fa AF086833.gb
网友评论