一、环境构建
为了防止主页过于混乱,我一般把跑的这些流程放在workspace目录
cd workspace
mkdir BSA
cd BSA
mkdir data
二、数据准备
- 文章:Identification of a cold-tolerant locus in rice (Oryza sativa L.) using bulked segregant analysis with a next-generation sequencing strategy - PubMed (nih.gov)
- 材料:Kongyu131(耐寒)×Dongnong422(不耐寒)→F2→RIL
-
文章的图:
ED
SNP-index - 数据下载:
①参考序列(IRGSP-1.0_genome.fasta);
mkdir data
cd data
mkdir ref
cd ref
#下载参考序列
wget https://rapdb.dna.affrc.go.jp/download/archive/irgsp1/IRGSP-1.0_genome.fasta.gz
gunzip IRGSP-1.0_genome.fasta.gz
#bwa构建索引
bwa index IRGSP-1.0_genome.fasta
#SRR6327815, SRR6327816, SRR6327817, SRR6327818
②测序数据(SRR6327815, SRR6327816, SRR6327817, SRR6327818)
ENA Browser (ebi.ac.uk)搜索SRR号获取下载序列,如下图,复制链接
ENA在NCBI上下载的是SRA格式,需要做数据转换,而从ENA上可以直接下载压缩过的fastq文件
#{a,b}.txt → a.txt b.txt
vi SRR.txt
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR632/005/SRR6327815/SRR6327815_{1,2}.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR632/006/SRR6327816/SRR6327816_{1,2}.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR632/007/SRR6327817/SRR6327817_{1,2}.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR632/008/SRR6327818/SRR6327818_{1,2}.fastq.gz
#后台批量下载
wget -b -i SRR.txt
网友评论