美文网首页科研信息学R
R - 序列标识图(sequence logo)

R - 序列标识图(sequence logo)

作者: 吴十三和小可爱的札记 | 来源:发表于2019-12-11 15:09 被阅读0次

在生物信息分析中,经常需要做序列标识图(sequence logo)。例如,突出序列比对中的保守位置,用于研究结构域序列相似性;临床上可视化DNA、RNA和蛋白质结合位点(激酶,SH2 / SH3域,转录因子(TFs),RNA结合蛋白,核酸酶,核糖核蛋白等)探索突变对重大疾病的影响。

ggseqlogo是一种非常理想的序列标识可视化软件,它不仅能够生成高质量的待发表的序列标识图,而且能够灵活地处理不同的输入格式。由于基于ggplot2包,因此具有高度可定制化性(允许使用定量和定性的配色方案,图例,不同的字体和视觉注释),并且允许与其他图形叠加。

数据类型

ggseqlogo能够接收和识别三种数据类型:

  1. 序列:Amino acids, DNA and RNA sequence types,一般ggseqlogo能猜测输入序列的类型,也可以用seq_type指定。自己制定的字母、数据、符号等。

  2. 矩阵:行是序列字母,列是序列位置的位置频率矩阵。

  3. 如果每个字母已经有了高度变量,只需创建一个矩阵,列名字序列字母,每个单元格都是高度变量,然后将方法设置为custom。(例:custom_mat = matrix( rnorm(20), nrow=4, dimnames=list(c('A', 'T', 'G', 'C'))) )

    custome_matrix.png

例子

sequence logo.png

see the full tutorial here

相关文章

  • R - 序列标识图(sequence logo)

    在生物信息分析中,经常需要做序列标识图(sequence logo)。例如,突出序列比对中的保守位置,用于研究结构...

  • R包ggseqlogo |绘制序列分析图

    简介 在生物信息分析中,经常会做序列分析图(sequence logo),这里的序列指的是核苷酸(DNA/RNA链...

  • R可视化——ggseqlogo包绘制序列分析图

        序列分析图(sequence logo)一般指以图形方式依次展示序列比对中各个位置上出现的残基及其频率,常...

  • 生信R画图

    能画的图: 先决条件:差异分析 热图 序列分析图sequence logo 使用ggseqlogo可视化moti...

  • 详解motif的PWM矩阵

    欢迎关注”生信修炼手册”! 通过一致性序列和sequence logo可以直观的表示某个motif的情况,但是在预...

  • Biostar_handbook||charpter 10_11

    Charpter 10 Sequence Pattern 模式匹配 Sequence Pattern序列模式:A ...

  • Sequence 序列

    手动实现一个序列 //手动实现一个迭代器,这是一个迭代器类 class ReverseIterator :Iter...

  • 序列——Sequence

    7.1About Sequencess(关于序列) 序列是数据库对象的一种。多个用户能够通过序列来生成连续的数字以...

  • Python 小知识点(一)

    join()方法str.join(sequence)sequence要连接的元素序列返回通过指定字符连接序列中元素...

  • Python enumerate() 函数和zip()函数

    语法:enumerate(sequence, [start=0]) 参数: sequence -- 一个序列、迭代...

网友评论

    本文标题:R - 序列标识图(sequence logo)

    本文链接:https://www.haomeiwen.com/subject/mdgogctx.html