usage: htseq-count [options] alignment_file gff_file
-f {sam,bam} (default: sam)
-r {pos,name} (default: name)
-s {yes,no,reverse} (default: yes) #此处关于选项-s为我自己的认识,不一定对
#数据是否来源于链特异性测序,链特异性是指在建库测序时,只测mRNA反转录出的cDNA序列,而不测该cDNA序列反向互补的另一条DNA序列;换句话说就是,链特异性能更准确反映出mRNA的序列信息
#我们知道在gff/gtf中第7列是+-信息,+表示来源于参考基因组序列正链,-表示参考基因组序列的反向互补链
#sam/bam文件的第2列是flag信息,也可以看出比对到正链还是负链
#stranded=no,无链特异性,一条reads通过flag列知道比对到+还是-链后,不管是不是和gff/gtf相匹配,都算是这个feature中的
#stranded=yes, 且se测序,要和gff/gtf相匹配,才算是这个feature中的
#stranded=yes, 且pe测序,要和gff/gtf相匹配,才算是这个feature中的
#stranded=reverse,是yes的相反,这时不是和gff/gtf相匹配了,而是恰好相反,可能源于另一种链特异性,只测cDNA序列反向互补的另一条DNA序列
-a MINAQUAL (default: 10)
#忽略比对质量低于此值的比对结果
-t FEATURETYPE
#feature type (3rd column in GFF file) to be used, all features of other type are ignored (default, suitable for Ensembl GTF files: exon)
#没想到这个还能自己设置
-i IDATTR
#GFF attribute to be used as feature ID (default, suitable for Ensembl GTF files: gene_id)
-m {union,intersection-strict,intersection-nonempty} (default: union)
网友评论