#从ncbi下载数据,GEO-GEO号/SRA-SRA号/SRA-SRP号,找到最终的SRP号,
#在搜索界面send to file:Runinfo,内含https下载链接
#或send to file:accession list,记下每一行值,补全链接为:
#ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR(前三位)/SRR(全名)/SRR(全名).sra
#下载目前使用idm和迅雷下载,prefetch下载太慢,ascp又不能用,后拷贝至分析端
0.环境准备(针对win10 ubuntu子系统)
#linux清密码
#apt换源(清华源)
#sudo apt-get update
#sudo apt-get upgrade
#安装图形界面(不装fastqc老是报错)
#安装中文语言包(随意)
#安装miniconda3,手动激活环境变量,更换源,更换python版本为3.6(3.7版有个东西用不了,啥东西暂时忘了)
#apt装fastqc,bwa,samtools,bamtools,trimmomatic,tree,pandoc,unzip,axel,aria2(zsh,oh-my-zsh)
#conda装sra-tools,multiqc,bowtie2
#手动安装aspera
1. sra转为fastq
fasterq-dump -3 -e 8 -p -o 输出路径 sra文件
#(-e 指定线程数,-3<=>--split-3,-p 唠叨模式)
rename 's/.sra//' 输入文件(去除文件名中的.sra)
2.质检
#将所有的数据进行质控,得到zip的压缩文件和html文件
fastqc -o 输出路径 -t 8 fastq文件1 fastq文件2 ... fastq文件n(-t 指定线程数)
multiqc -t default -o 输出路径 -f 输入路径(-t 输出格式为默认)
3.比对
bowtie2 --local -3 整型-5 整型 -p 6 -x index位置 -U fastq文件 | samtools sort -o 输出的排过序的bam文件路径及名称
# --local表示使用local模式,在这种模式下,Bowtie2不要求整个读取从一端到另一端对齐。相反,为了达到最大可能的对齐分数,可以从末端省略一些字符(“软裁剪”)
#(-p 指定线程数, -U 表示单端测序,-3或-5 表示从3‘端或5端’某个碱基位置开始修剪)
4.peak calling
macs callpeak -c 对照的bam文件 -t 实验的bam文件 -q 0.05 -f BAM -g mm -n suz12
#(-q FDR值,-f 输入文件格式,-g 基因组类别,-n 输出文件的前缀名)
#narrowPeak结尾的文件可导入进行分析
网友评论