美文网首页
数据过滤

数据过滤

作者: YZZZZZero | 来源:发表于2020-09-24 20:24 被阅读0次

步骤:
(0)perl 手动去除第一行index六个碱基
(1)去除低质量的reads(质量值Q≤19的碱基占总碱基的50%以上);
(2)默认参数滑窗去掉质量低的碱基,最终去除长度小于100的reads
(3)去除含N比例大于5%的Reads;
(4)去除与核糖体RNA(rRNA)匹配的Reads #sortmerna
(5)质量评估:fastqc

#工具:选一种即可
conda install -c trimmomatic
conda install fastp
#参数:
fastp --detect_adapter_for_pe -l 100 -q 19 -u 50 -i ~/CK18_1.fq.gz -o CK18c_1.fq.gz -I ~/CK18_2.fq.gz -O CK18c_2.fq.gz \
#或者:
trimmomatic PE -phred33 CK18_1.fq.gz CK18_2.fq.gz CK18_1paired.fq.gz CK18_1unpaired.fq.gz CK18_2paired.fq.gz CK18_2unpaired.fq.gz ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:19 MINLEN:50
#质量评估:fastqc
fastqc -o ./ -t 4 ./ CK18c_11.fq.gz

附:
1.转换注释文件格式(gtf或gff3)使用Cufflinks里面的工具gffread:

#gff2gtf
gffread my.gff3 -T -o my.gtf
#gtf2gff
gffread merged.gtf -o- > merged.gff3

相关文章

网友评论

      本文标题:数据过滤

      本文链接:https://www.haomeiwen.com/subject/fwhtuktx.html