HTSeq-count原理

作者: 苏牧传媒 | 来源:发表于2018-08-16 02:30 被阅读0次

如何判断一个reads属于某个基因, htseq-count 提供了union, intersection_strict, intersection_nonempty 3 种模型,如图(大多数情况下作者推荐用union模型):

基本用法:

htseq-count [options] alignment_file gff_file

-f 指定输入文件的格式,可以是 sam或 bam格式,默认是sam.

-s 是否这个数据是来自链特异性建库(默认 yes)

-a 指定一个最低 read mapping质量值,低于值会被过滤掉,默认是10

-t 指定最小计数单位类型,默认值是:exon

-i GFF文件的一类属性,最终的计数单位,默认值是:gene_id

-m 判断一个reads属于某个基因的模型,默认:union

生成count:

基因名 reads计数

ENSMUSG00000000001.4 1648

合并成数据框:

参考图片

下面就是用R包进行差异基因分析了。

ref:转入组入门六(mac 版): reads计数 - 简书

相关文章

网友评论

    本文标题:HTSeq-count原理

    本文链接:https://www.haomeiwen.com/subject/reagbftx.html