美文网首页
2023-03-27刘亦菲转录组数据

2023-03-27刘亦菲转录组数据

作者: pudding815 | 来源:发表于2023-03-26 19:38 被阅读0次

根据文章提供的SRA去下

从SRA下载的数据竟然是lite.1格式

需要sra-tools最新版本解压,偷偷下在我文件夹下了


/storage2/anlei/wangwenjing/lml/sratoolkit.3.0.2-ubuntu64/bin/fastq-dump --split-3 $SRR.lite --gzip

解压出来就是_1 _2两个双端数据


1、TrimGlore过滤

trim_galore -q 25 --phred33 --length 35 -e 0.1 --stringency 3 --paired -o /storage2/anlei/wangwenjing/lml/trim_clean SRR12730680.lite.1_1.fastq.gz SRR12730680.lite.1_2.fastq.gz

2、Hisat2比对

首先需要建立索引,NCBI下载的fa基因组和gtf注释


extract_exons.py genomic.gtf >genome.exon.gtf

extract_splice_sites.py genomic.gtf > genome.ss.gtf

hisat2-build GCF_002917755.1_EL10_1.0_genomic.fa -p 10 --ss genome.ss.gtf --exon genome.exon.gtf /sugar_index

以上是甜菜index的建立

hisat2 -p 20 -x /storage2/anlei/wangwenjing/index/hisat2/sugar/sugar_index/sugar -1 SRR12730680.lite.1_1_val_1.fq.gz -2 SRR12730680.lite.1_2_val_2.fq.gz -S SRR12730680.sam

还不错

3、sam转bam

samtools sort -O bam -@ 25 SRR12730680.sam -o /storage2/anlei/wangwenjing/lml/hisat2_bam/SRR12730680.sort.bam

4、featurecount计算counts数

featureCounts -T 40 -g gene_id -a /storage2/anlei/wangwenjing/index/hisat2/sugar/sugar_index/genomic.gtf -o /storage2/anlei/wangwenjing/lml/count/SRR12730680_count.txt SRR12730680.sort.bam

相关文章

网友评论

      本文标题:2023-03-27刘亦菲转录组数据

      本文链接:https://www.haomeiwen.com/subject/yfoordtx.html