本期内容为[跟着NC做基因组数据分析],这是你需要的教程,对你一定有帮助。
前言
今天花费找文章,看到一篇关于基因组,组装的文章,主要是里面的图吸引了我的关注。后面仔细一看,作者竟然提供了分析的代码流程,还是比较详细的。提供的代码,基本是可以满足大部分初学者的需求,作为初学者的你还不仔细看看呢??
原文
--
详细代码:
仅比对的流程就有6个,包括有参、无参比对
1-Genome analysis
Hista-samtools 流程
#!/bin/bash
genome=$1
index=${genome%.*}
rna_1_fq=`cat $2|grep 1P|sed ":a;N;s/\n/,/g;ta"` #1.fq path list
rna_2_fq=`cat $2|grep 2P|sed ":a;N;s/\n/,/g;ta"` #2.fq path list
#echo $index
hisat2-build -p 20 $genome $index
hisat2 -x $index \
-1 $rna_1_fq\
-2 $rna_2_fq\
--threads 20 \
--min-intronlen 20 \
--max-intronlen 20000 \
--dta \
--score-min L,0.0,-0.4 \
-S ${index}.sam
samtools sort -@ 20 \
-o ${index}.sorted.bam \
-O BAM \
${index}.sam
Trinty Denovo流程
#!/bin/bash
#conda activate trinity
export PATH="$PATH:/usr_storage/jcf/.conda/envs/trinity"
rna_1_fq="cat $1|sed ":a;N;s/\n/,/g;ta"" #1.fq path list
rna_2_fq="cat $2|sed ":a;N;s/\n/,/g;ta"" #2.fq path list
bam="$3" #sorted.bam from hisat
out=${bam%.*}
Trinity --left $rna_1_fq \
--right $rna_2_fq \
--seqType fq \
--max_memory 100G \
--no_normalize_reads \
--CPU 20 \
--bflyCalculateCPU \
--output trinity_denovo_$out
Trinity --genome_guided_bam $bam \
--genome_guided_max_intron 10000 \
--max_memory 100G \
--no_normalize_reads \
--CPU 20 \
--bflyCalculateCPU\
--output trinity_GG_$out
--
此外,还有Indel、SNP和SV的分析。
...........................
...........................
...........................
干活满满,就看你自己如何来学习。
--
获得代码,请回复正确的关键词!!
--
欢迎大家关注我的公众号!!
小杜的生信筆記 ,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!
网友评论