美文网首页算法
求2个字符串的最长公共子串

求2个字符串的最长公共子串

作者: Stroman | 来源:发表于2018-03-10 20:28 被阅读625次

实用价值

比如,用于比较2个DNA序列中最大相同的部分。

思路1

遍历两个数组,碰到相同的字符就继续比较它们接下来的字符,只要相同就继续比较下去,直到字符不同或者字符串末尾,然后查看它是不是最长的公共子串。这样遍历完就可以得到两个字符串的公共子串了。不过这个算法太慢了,已经达到了3次方的级别了,是O(m×n×m)了。

思路2

使用动态规划算法,画表格解决问题。该问题的极限子问题就是1个字符的比较了,每个单元格的左上角单元格就是2个数组中每个字符前面的那个字符是否相等。于是只要2字符串的字符不相等那对应的单元格就置0,否则就等于1+它左上角的单元格中的值。于是就可以得到想要的结果了,这个的时间复杂度是O(m×n),时间也不短啊。

代码使用

package com.company;

public class Main {

    public static void main(String[] args) {
    // write your code here
        String string0 = "abcdefghijklmnop";
        String string1 = "abcsafjklmnopqrstuvw";
        System.out.println(Solution.findLongestCommonSubstring0(string0,string1));
    }
}

输出

jklmnop

Process finished with exit code 0

代码实现

package com.company;

public class Solution {
    /**
     * 找出两个字符串的最长公共子串
     * 本方法采用的是遍历的方式,时间复杂度是O(n^3)。
     * 时间有点长啊!
     * @param string0
     * @param string1
     * @return
     */
    static public String findLongestCommonSubstring(String string0,String string1) {
        StringBuilder maxSubstring = new StringBuilder();
        for (int counter = 0;counter < string0.length();counter++) {
            for (int counter0 = 0;counter0 < string1.length();counter0++) {
                int pointer0 = counter;
                int pointer1 = counter0;
                int commonSubstringLength = 0;
                while (pointer0 < string0.length()
                        && pointer1 < string1.length()
                        && string0.charAt(pointer0) == string1.charAt(pointer1)) {
                    commonSubstringLength++;
                    if (commonSubstringLength > maxSubstring.length()) {
                        maxSubstring.delete(0,maxSubstring.length());
                        maxSubstring.append(string0.substring(counter,pointer0 + 1));
                    }
                    pointer0++;
                    pointer1++;
                }
            }
        }
        return maxSubstring.toString();
    }

    /**
     * 所谓动态规划思想就是认为大问题可以被拆分成小问题。
     * 它一般有3个性质:
     * 1、无论是总问题还是子问题都存在最优解。
     * 2、某问题只取决于它的子问题,和由它组成的问题没关系。
     * 3、各子问题之间大多是相互关联的。
     * 它每一阶段都有各个子问题的最优解,各子问题的最优解
     * 会产生往往会重复计算,于是用一个表把它们存储起来。
     * 具体到本问题就是每一个字符的相同,然后逐步到原来
     * 问题的解。
     * 本问题的解是两个字符串的最长公共子串,那么它的子
     * 问题的解的极限是1个字符是否相同。
     * 在解集中每个单元格的左上角的单元格就是前面相邻的两
     * 个字符是否相同。并且如果该单元格对应的下标不同,那
     * 么单元格可以立刻被置0.否则它就应该加上左上角的单元
     * 格中的解的值。
     * 应用动态规划算法以后时间复杂度变成了O(n^2)。
     * @param string0
     * @param string1
     * @return
     */
    static public String findLongestCommonSubstring0(String string0,String string1) {
        int[][] answerArray = new int[string0.length()][string1.length()];
        int maxSubstringLength = 0;
        int startLongestIndex = 0;
        for (int counter = 0;counter < string0.length();counter++) {
            for (int counter0 = 0;counter0 < string1.length();counter0++) {
                if (string0.charAt(counter) == string1.charAt(counter0)) {
                    if (counter - 1 >= 0 && counter0 - 1 >= 0)answerArray[counter][counter0] = answerArray[counter - 1][counter0 - 1] + 1;
                    else answerArray[counter][counter0] = 1;
                    if (answerArray[counter][counter0] > maxSubstringLength) {
                        maxSubstringLength = answerArray[counter][counter0];
                        startLongestIndex = counter - maxSubstringLength + 1;
                    }
                } else answerArray[counter][counter0] = 0;
            }
        }
        return string0.substring(startLongestIndex,startLongestIndex + maxSubstringLength);
    }
}

相关文章

  • 19.2-求最大公共子串

    练习1:求2个字符串的最长公共子串;

  • 2019-10-29

    求2个字符串的最长公共子序列和最长公共子字符串 一. 最长公共子序列 定义: 一个数列S,如果分别是两个或多个已知...

  • LCS 问题求解

    LCS : longest common substring 即最长公共子串 LCS 问题就是求两个字符串最长公共...

  • 每天一道算法题18

    【最长公共子序列,子串】给定两个字符串上str1 和 str2, 求两个字符的最长公共子序列和最长公共子串。 最长...

  • 最长公共 / 对称字串

    求最长对称字串是求最长公共子串的变形.. (๑˘ ˘๑) 最长公共子串 Longest Common Subseq...

  • Java算法:求两个字符串的最长公共子序列问题

    最长公共子序列问题: 给定两个字符串A、B,求A与B的最长公共子序列(子序列不要求是连续的)举例:字符串A: ab...

  • 练习题:最长公共前缀

    求字符串数组内字符串的最长公共前缀

  • 字符串算法

    最长公共前缀 最长回文串 最长回文子序列 最长公共子串 反转单词顺序列 反转字符串 字符串转数字 IP-int互转

  • 最长公共子串

    问题: 找出最长、连续的子字符串 思路: 遍历X、Y的所有子字符串,找出最长公共后缀,则最长公共后缀的长度就是最长...

  • LeetCode第32题: 最长有效括号 longestVali

    思路1:这个序列问题,很容易联想到用动态规划的思路来解最长公共字符串的问题,区别在于,在求最长公共字符串的时候,子...

网友评论

    本文标题:求2个字符串的最长公共子串

    本文链接:https://www.haomeiwen.com/subject/snmbfftx.html