美文网首页RNA-seq
RNA seq上游分析(简洁版)

RNA seq上游分析(简洁版)

作者: Insc | 来源:发表于2022-09-01 13:46 被阅读0次

环境配置

conda create -n rna python=3.9
conda activate rna
conda install -y multiqc trim-galore subread hisat2 

质检

fastqc *.fastq.gz
multiqc *.zip

去接头

vim fastq_list.txt ### 构建自己的文件列表
cat fastq_list.txt | while read id; 
do (trim_galore -q 20 \
--phred33 --stringency 3 \
--length 20 -e 0.1 \
--paired  ${id}_L002_R1_001.fastq.gz ${id}_L002_R2_001.fastq.gz \
--gzip -o ./clean ); done

比对

mkdir aligned
cat ./fastq_list.txt | while read id; 
do (hisat2 -t -p 20 -x ~/ref/hg38/genome \
-1 ./clean/${id}_L002_R1_001_val_1.fq.gz -2 ./clean/${id}_L002_R2_001_val_2.fq.gz \
-S ./aligned/${id}.sam); done

得到count值

mkdir counts
cat ./fastq_list.txt | while read id; 
do (featureCounts -T 5  \
-t exon \
-g gene_id \
-a ~/ref/Homo_sapiens.GRCh38.107.chr.gtf \
-o ./counts/${id}_counts.txt \
./aligned/${id}.sam); done

最终会在目标文件夹下面获得两个文件,counts.txt和counts.txt.summary。在R中进行ID转换即可。

相关文章

网友评论

    本文标题:RNA seq上游分析(简洁版)

    本文链接:https://www.haomeiwen.com/subject/rowjnrtx.html