美文网首页机器学习算法
算法(三)列举所有k-mer的组合

算法(三)列举所有k-mer的组合

作者: 生信了 | 来源:发表于2019-11-18 22:37 被阅读0次

原创:hxj7

关键词:k-mer; recursive; trick;

什么是k-mer?</font>
比如,“ATGC”的所有1-mer是:’A’, ‘T’, ‘G’, ‘C’。共4^1=4种组合。
而“ATGC”的所有2-mer是
“AA”, “AT”, “AG”, “AC”
“TA”, “TT”, “TG”,“TC”
“GA”, “GT”, “GG”,“GC”
“CA”, “CT”, “CG”,“CC”
共4^2=16种组合。

那么如何打印出所有的k-mer组合呢?如果是2-mer,我们可以用两个for循环来列出所有组合,如果是3-mer,可以用三个for循环。但是如果是10-mer呢?岂不是要10个for循环?那代码也太难看了。况且当k未知时,你都不知道要写几个for循环!

今天我们介绍两种来自Biostar论坛中网友给出的方法,我们可以学习参考一下:

第一种:递归方法
递归(recursive)方法作为一种常规算法,自然是会想到的,简化后的代码如下:

image

第二种方法:trick~
第二种方法很有技巧性,十足的trick。简化后的代码如下:

image
该方法由lh3给出,简洁优美。其关键在于:经过k次“y>>2以及y&3”的运算后会生成k个介于[0, 3]的值,如果把这些值当做一个序列,当y不同时,生成的序列是不可能完全一样的。从而会生成不同的k-mer。

细细研读这段代码后,可以发现这种方法只适用于字符串长度为2的指数的情况。比如”AB”(长度为2), “ABCD”(长度为4)或”ABCDEFGH”(长度为8)等情形,而像”ABC”这种就不适用了。从普适性的角度讲,递归方法更胜一筹,因为它适用于任何长度的字符串。

最后
我们再给出列举“ABCDEFGH”的所有k-mer组合的代码:

image

如果任何问题欢迎交流!

(公众号:生信了)


image

相关文章

  • 算法(三)列举所有k-mer的组合

    原创:hxj7 关键词:k-mer; recursive; trick; 什么是k-mer? 比如,“ATGC”的...

  • 列出所有组合的算法

    实现combinations( List data, int n) n==2,当n变的更大的时候...

  • PHP实现排列组合算法

    一、组合算法 给定一非重复字符串所有的组合,形如 abc,则Q1:输出所有组合 a,b,c,ab,ac,bc,ab...

  • 穷举算法

    穷举算法思想 将问题的所有可能的答案一一列举,然后根据条件判断答案是否合适,保留合适的,丢弃不合适的。 算法步骤:...

  • 遍历算法

    遍历算法很有可能是我们这个世界的底层算法之一。 遍历算法简单的理解就是对所有可能的组合进行一个又一个地验证,验证的...

  • 数组

    [ 1,8,2,7,3,6,4,5]写一个算法,把数组中的满足a+b=9的所有组合输出来,并记录有多少个组合

  • C++列举所有的24点组合(无递归)

    事实上只有495种可能的输入,这其中有404种能计算出24点.所有可能的输入:total = ABCD+AAAA+...

  • 2018-08-02

    php实现组合枚举算法 源码

  • 【算法】时间复杂度 & 常用算法列举

    0. 什么是时间频度? 一个算法的执行时间和算法中语句的执行次数成正比,也就是执行的语句越多,花费的时间越长。一个...

  • Illumina paire-end 序列拼接中的Kmer

    2021.3.23 1. k-mer的定义 k-mer就是一段短的DNA片段,DNA的长度为5bp,则叫做5-me...

网友评论

    本文标题:算法(三)列举所有k-mer的组合

    本文链接:https://www.haomeiwen.com/subject/yljiictx.html