美文网首页
HOMER安装和使用

HOMER安装和使用

作者: 笺牒九州的怪咖 | 来源:发表于2022-02-22 12:19 被阅读0次

1.HOMER的作用?

HOMER是一套基于 C++ 和 Perl 语言的用于 motif 查找和二代数据分析的工具,一般需要两个序列作为参数:

  • 参考序列:hg19、mm10 等基因组序列、promoter 序列、自定义的 FASTA 序列
  • 所要分析的序列:DNA 或 RNA 序列

HOMER 适用于在大规模数据中寻找 DNA 或 RNA 序列的 motif。

那什么是 motif 呢?

motif:反复出现的模式,即一种特征序列,比如 sequence motif, structure motif, network motif。它有或者可能有一定的生物学功能。

2.如何安装HOMER?

HOMER软件使用Perl和C++编写,可在UNIX系统流畅运行,在windows系统则需要先安装cygwin或者Unix虚拟系统。

本文主要介绍在linux/UNIX的安装,简单介绍在windows系统的安装

有问题请参考HOMER官方安装过程

2.1 For Linux/UNIX

  1. 先下载 configureHomer.pl 到目标文件夹(如 public/softwares/HOMER),然后使用cd切换到该文件夹并运行:
perl configureHomer.pl -install # 下载homer.package.zip 
vi ~/.bash_profile # 修改./bash_profile 
PATH=$PATH:/public/softwares/HOMER/homer/bin/ # 将homer软件中的/bin/目录添加到./bash_profile
:wq # 保存退出 
source ~/.bash_profile # 使修改内容马上生效

补充说明“.bash_profile”和“.bashrc”的区别
1. ~/.bash_profile: The personal initialization file, executed for login shells
2. ~/.bashrc: The individual per-interactive-shell startup file

根据名字的不同,我们可以直观地将startup文件分为“profile”与“rc”两个系列,它们的功能都很类似,只是使用的场景不同。执行“profile”系列还是“rc”系列,取决于运行中的bash处于“交互”还是“登陆”。

(不过这个没弄明白也没有关系,不影响后续操作。)

2. 在命令行输入'R',安装两个R包(DESeq2和EdgeR):

> source("https://bioconductor.org/biocLite.R") 
> biocLite() 
> biocLite("DESeq2") 
> biocLite("edgeR") 
> q() # 退出R

3. 安装samtools,使用conda进行安装:

conda install samtools

2.2 For Windows

先从 http://www.cygwin.com/ 下载 cygwin 并安装。

注意:

  1. 在 homer/bin/ 去掉文件的 "*.exe" 后缀 (i.e. "homer.exe" to "homer")
  2. PATH=/Users/chucknorris/homer/bin:${PATH},格式和linux不同

其他的和linux下安装过程大同小异~

如果安装过程和说明的一样,排除多种可能但还是报错。恭喜你找到了一个bug!!!可以描述出错的具体内容给作者发邮件(cbenner@ucsd.edu)。

3. 如何使用HOMER寻找motif?

HOMER主要有三种功能:

1.findMotifs.pl

2.findMotifsGenome.pl

By default this will perform de novo motif discovery as well as check the enrichment of known motifs.

3.scanMotifGenomeWide.pl

具体使用方法:

3.1 寻找DNA序列的motif

HOMER最早是被开发用来寻找CHIP-Seq peaks数据中的motif。现在,它不仅可以被用来分析CHIP-Seq,还可用于分析基因组座位从而寻找motif。

用户只需要提供包含基因组坐标的文件,比如peak文件或BED文件。剩下的就不用操心啦~

分析peak文件中富集的motif,可以使用以下代码:

findMotifsGenome.pl <peak/BED file> <genome> <output directory> -size # [options]

代码示例:

findMotifsGenome.pl ERpeaks.txt hg18 ER_MotifOutput/ -size 200 -mask
# -mask 使用repeated-mask序列
# -size 设置motif长度

完整的输出结果可以查看,包括:

  1. **homerMotifs.motifs<#> **: these are the output files from the de novo motif finding, separated by motif length, and represent separate runs of the algorithm.
  2. homerMotifs.all.motifs : Simply the concatenated file composed of all the homerMotifs.motifs<#> files.
  3. motifFindingParameters.txt : 记录执行findMotifsGenome.pl的命令
  4. knownResults.txt : 记录motif的统计数据,text file(open in EXCEL).
  5. seq.autonorm.tsv : autonormalization statistics for lower-order oligo normalization.
  6. homerResults.html : *de novo *motif finding的格式化输出.
homerResults.html

参考:http://homer.ucsd.edu/homer/motif/index.html

3.2 寻找RNA序列的motif

和寻找DNA序列的motif区别在于:使用 findMotifs.pl和 findMotifsGenome.pl时,要加上 “-rna”参数,从而只寻找RNA+链的motif,并且匹配/显示U而不是T。

注意!HOMER尚未包含“RNA motif”列表,所以不支持“已知motif”的分析。如果使用FASTA文件格式,请在输入文件中使用T(DNA编码)。

代码示例1:

# 获取目标序列在人类mRNA上聚集的motif
findMotifs.pl mir1-downregulated.genes.txt human-mRNA MotifOutput/ -rna -len 8

结果:

image

代码示例2:

# 分析CLIP-Seq for RNA motifs 
findMotifsGenome.pl fox2.clip.bed hg17 MotifOutput -rna

结果(a UGCAUG FOX motif):

image

3.3 获取已知Motif序列在全基因组上的分布情况

使用scanMotifGenomeWide.pl,代码如下:

scanMotifGenomeWide.pl <motif file> <genome> [options] 

# e.g. 小鼠mm10上已知motif的分布情况
scanMotifGenomeWide.pl pu1.motif mm10 -bed > pu1.sites.mm10.bed
# -bed : Output file will be in BED format - useful when you want to upload to the UCSC browser.

与MEME比较而言,个人觉得Homer比较顺手!
通过meme去来找motif,需要bed格式的peaks的坐标来获取fasta序列。
MEME,链接:http://meme-suite.org/

-------------------------------------------------------------------------------------------------------------------------------------------------------------I'm a line ! Thanks for your attention !----------------------------------------------------------------------------------------------------------------

相关文章

  • Homer

    使用 conda 安装 Homer 默认安装 homer 最新版conda install homer -y ...

  • homer安装和使用

    介绍 安装 1.下载homer文件 网址:http://homer.ucsd.edu/homer/download...

  • HOMER安装和使用

    1.HOMER的作用? HOMER是一套基于 C++ 和 Perl 语言的用于 motif 查找和二代数据分析的工...

  • homer的安装

    homer的安装 第一种方式:用conda进行安装conda install -c bioconda homer ...

  • 2021-09-29-motif-homer分析

    软件安装 下载configureHomer链接[http://homer.ucsd.edu/homer/confi...

  • Motif 分析

    1. Homer 1.1. homer的安装和配置 按照这个链接里的教程进行。 1.2. install mm10...

  • Motif Discovery | DREME

    写在前面 文献中常用的有DREME和HOMER,这次先搞定DREME,下次再写HOMER。 使用MEME套件中的D...

  • Motif 分析(1) - HOMER 安装

    HOMER 是一套用于Motif查找和二代数据分析的工具。HOMER 中的工具是使用Perl 和C++编写的,适用...

  • ubuntu安装homer

    ref: Homer Software and Data Download # 满足条件: The followi...

  • Homer软件的介绍-Homer 找 DNA motif

    HOMER 是一套用于Motif查找和二代数据分析的工具。HOMER 中的工具是使用Perl 和C++编写的,是L...

网友评论

      本文标题:HOMER安装和使用

      本文链接:https://www.haomeiwen.com/subject/hrhglrtx.html