美文网首页甲基化数据分析
群体DNA甲基化分析1——基因组各个组分相关统计

群体DNA甲基化分析1——基因组各个组分相关统计

作者: 只看不写_nathan | 来源:发表于2020-11-14 11:49 被阅读0次

    写于20201114
    这部分,我是进行了基因组各个组分的一些统计。详细内容如下:

    • 01.DMR和NSR在基因组中各个组分的占比
    • 02.基因组各个基因组成分(exon、intron、TE和intergenic)的核酸多态性
    • 03.各个亚群这些组分的核酸多态性分析
    • 04.DMR、DSR和NSR这些组分的核酸多态性
    • 05.DMR中各个组分的遗传多样性比较
    • 06.整体DMR遗传多样性比较
    • 07.DMR在基因组分上的分布(分Hyper和Hypo)
    • 08.总体PIM到CER和CER到BIGD甲基化水平的趋势
    • 09.三种类型DNA甲基化circos图
    • 10.6圈DMR一圈驯化,一圈染色体的整体DMR的图谱
    • 11.DMR的频率分布
      借鉴文章中的结果图:

      1. 图1
      2. 图2
      3. 图3
      4. 图4
      5. 图5
      6. 图6-1
      7. 图6-2
      8. 图7
      9. 图8
      10. 图9
      11. 图10
      12. 图11

    -------------------------------------------------------------------------------------

    1.DMR和NSR在基因组中各个组分的占比
    获取基因间区序列,需要先获取gene.bed和TE.bed,然后用bedtools complement 进行找到互补区域
    bedtools complement -i gene.bed -g genome.bed
    但是注意的是,这个互补区域中每条染色体的第一个位置为0,这样会对后面bedtools 操作造成报错。

    获取TE、exon、intron和intergenic的bed后,用bedtools的intersect进行取交集,反映出覆盖了多少组分。
    bedtools intersect -a exon.bed -b DOM.fin.bed -wb |awk '{print $4"\t"$5"\t"$6}' |less > temp.bed最开始我没想到,会有重复的行,所以造成间区和TE的区域特别多,后来我想到这个问题,所以需要添加bedtools sort -i temp.bed > temp.s.bedbedtools merge -i temp.s.bed |awk '{sum+=($3-$2)}END{print sum}'|less
    这样得到DMR和DSR的组分信息。

    相关文章

      网友评论

        本文标题:群体DNA甲基化分析1——基因组各个组分相关统计

        本文链接:https://www.haomeiwen.com/subject/dmnibktx.html