The MEME suite 是一组功能强大的,基于网页的集成工具,可用于研究蛋白质,DNA 和 RNA 中的序列模体。
The MEME Suitehttps://meme-suite.org/meme/可以通过这个网址访问主页
用 MEME 搜索模体
Step1:工具准备
将用到 MEME 套件下的 MEME-ChIP 工具,由于高通量测序的进步导致大型高质量数据集的快速增长,包括转录因子(TFs)ChIP-seq 实验产生的数据集。尽管有很多现有的工具可以用这类数据集来发现转录因子结合位点,但大多数基于网页的工具无法直接处理此类大型数据集。


此工具旨在分析 ChIP-seq 的 “峰值区域”,也就是说仅分析峰值周围的短基因组区域,给定一组基因组的区域后它将依次值行以下操作
(i)从头开始寻找模体
(ii) 对模体进行富集分析
(iii) 模体可视化
(iv) 结合亲和力分析
(v) 模体识别
Step2:数据准备
上传的区域应为FASTA格式的序列,其长度至少为100 bp,每个序列均以ChIP-seq标签峰为中心。所有序列都会被输入到DREME基序发现算法中,但是由于计算复杂性,最多有 600个序列(从输入中随机选择)被输入到MEME算法中。

Step3:设置参数
点击选择上传文件

此处可以输入邮箱,模体搜索完成后将会发邮件通知

此处可以设置目标模体长度

接下来就可以设置一些细节

MEME options下可以设置寻找模体的个数等。
STREME options下可通过设置P值,挖掘序列中富集或相对富集的模体。
CentriMo options可以识别一些模体对特定位置的明显偏好,可以查看局部位置的富集程度。
MEME-ChIP还将每个MEME和DREME寻找到的motif与JASPAR CORE数据库中的每个motif进行比较,以识别与每个主题结合的可能转录因子。
Step4:开始寻找motif
将所有参数设置好后点击开始寻找motif

出现此界面即已经开始进行模体搜索了

然后等结果出来后点击HTML output查看结果

接着点击MEME查看详细的motif信息

可以下载对应的motif的logo图 和位置频率矩阵

参考文献:
[1] Bailey T L , Johnson J , CE Grant, et al. The MEME Suite[J]. Nucleic Acids Research, 2015, 43(W1):W39-W49.
[2]Machanick, Philip, Bailey, et al. MEME-ChIP: motif analysis of large DNA datasets.[J]. Bioinformatics, 2011.
网友评论