美文网首页R作图生物信息学
测序深度分布图及代码(shell和R)

测序深度分布图及代码(shell和R)

作者: gtt儿_生物信息学习 | 来源:发表于2019-09-29 17:24 被阅读0次

    微信公众号:生物信息学习

    有一个bed文件,想要知道这个bed文件对应的测序深度的分布,bed文件如下图所示:

    chr1    4427277 4427583
    chr1    4429216 4429458
    

    用samtools对这个区间内的每个点做深度计算,代码如下:

    samtools depth test_sorted_dedup.bam -b test.bed >test.stat
    

    结果如下所示(其中第一列为染色体,第二列为position,第三列即为这个position的深度):

    chr10   3787066 109
    chr10   3787067 108
    chr10   3787068 109
    chr10   3787069 111
    chr10   3787070 111
    chr10   3787071 111
    chr10   3787072 111
    chr10   3787073 112
    chr10   3787074 114
    chr10   3787075 115
    chr10   3787076 116
    chr10   3787077 118
    

    用shell对区间内所有的测序深度的depth做统计,代码如下:

    cut -f3 test.stat |sort|uniq -c >test.stat.count
    

    统计后的结果如下所示:

    3503    55
    5097    1
    2508    265
    3607    42
    4453    8
    4694    7
    1300    2762
    2898    165
    

    其中第二列为depth,第一列为这个depth的频数,如第一行,即表示有3503个点的深度为55.

    接下来用R做这些深度分布图,代码如下:

    library(ggplot2)
    mytest<-read.table("test.stat.count")
    names(mytest)<-c("depth","count")
    ggplot(mytest,aes(x=depth,y=count))+geom_point(col="red")
    

    结果如下所示:

    image

    测序深度的分布图就出来了。

    微信公众号:生物信息学习

    相关文章

      网友评论

        本文标题:测序深度分布图及代码(shell和R)

        本文链接:https://www.haomeiwen.com/subject/tupxyctx.html