如何判断一个reads属于某个基因, htseq-count 提供了union, intersection_strict, intersection_nonempty 3 种模型,如图(大多数情况下作者推荐用union模型):

基本用法:
htseq-count [options] alignment_file gff_file
-f 指定输入文件的格式,可以是 sam或 bam格式,默认是sam.
-s 是否这个数据是来自链特异性建库(默认 yes)
-a 指定一个最低 read mapping质量值,低于值会被过滤掉,默认是10
-t 指定最小计数单位类型,默认值是:exon
-i GFF文件的一类属性,最终的计数单位,默认值是:gene_id
-m 判断一个reads属于某个基因的模型,默认:union
生成count:
基因名 reads计数
ENSMUSG00000000001.4 1648
合并成数据框:

下面就是用R包进行差异基因分析了。
网友评论