Motif中的PWM矩阵

作者: 生信编程日常 | 来源:发表于2019-11-27 23:15 被阅读0次

PWM矩阵是表示motif的一种方式,全称是position-specific weight matrix (PSWM) 或者是position-specific scoring matrix (PSSM)。比如CTCF的motif序列为(来自于JASPAR数据库):

要构建出PWM矩阵,首先要得到position frequency matrix (PFM),即在每个位置的四种核苷酸出现的次数。比如说CTCF的PFM序列为 (图中为JASPAR中的.jaspar文件):

也就是在第一个位置A出现了87次,C出现了291次,G出现了76次,T出现了459次。将每个位置的频数转换为频率 (某核苷酸的出现数量/这个位置四种核苷酸的总数量),可以得到position probability matrix (PPM) (图中行列互换 用的是JASPAR中的.meme文件):

最后通过以下公式将PPM转换为PWM:

其中M是指的这个位点的probability,b是指的background (上图的background为0.25)。上图中CTCF的PPM转化为PWM为:

 motif可以由meme等软件找到,也可以从JASPAR, CISBP, HOCOMOCO等数据库中下载得到,meme的官方网站(http://meme-suite.org/tools/meme)提供了一系列的处理软件和现有的motif PWMs。

得到motif PWM后,可以用Fimo或其他软件在基因组中扫描得到序列,其基本用法为:

fimo [options] <motif file> <sequence file> 

提供motif的PWM文件和参考基因组即可。

扫描关注微信公众号,学习更多的生信和编程知识,每天进步一点点!

相关文章

  • Motif中的PWM矩阵

    PWM矩阵是表示motif的一种方式,全称是position-specificweightmatrix(PSWM)...

  • 详解motif的PWM矩阵

    欢迎关注”生信修炼手册”! 通过一致性序列和sequence logo可以直观的表示某个motif的情况,但是在预...

  • R语言-制作motif的PWM

    一、PWM与PFM的介绍 motif指的是转录因子偏好结合的DNA序列模式或RNA结合蛋白偏好结合的序列模式,一般...

  • 生信地基系列--PWM位置权重矩阵

    位置权重矩阵(PWM)又称位置特异性权重矩阵(position-specific weight matrix ,P...

  • 位点特异矩阵

    1.简要说明位点特异矩阵(position weight matrix ,PWM), 或者位置特异矩阵(posit...

  • ATAC-seq(6) -- 寻找motif及差异peak分析

    寻找motif 构造HOMER软件指定使用的peak文件格式 差异peak分析 构造计数矩阵 拿到表达矩阵后,后面...

  • 详解motif的PFM矩阵

    欢迎关注”生信修炼手册”! 在之前的文章中,对motif的几个基本概念进行了简单介绍。一致性序列采用IUPAC碱基...

  • 基因家族分析(4)motif 预测

    本节讲解如何进行 motif 预测,seqlogo 和motif位置展示。 motif预测 motif 预测使用 ...

  • 展示基因家族的结构域

    motif与domain motif(模体)是蛋白中较小的保守序列片段,概念比domain小。PROSITE是专门...

  • 10.13知识点总结

    今天学了PWM脉宽调制 占空比=有效宽度/总长度 有效电压=占空比*幅值 PWM1模式中是小于CCR有效 PWM2...

网友评论

    本文标题:Motif中的PWM矩阵

    本文链接:https://www.haomeiwen.com/subject/znzmwctx.html