最长回文子串

作者: HITMiner | 来源:发表于2017-08-16 00:41 被阅读37次

最长回文子串
字符串算法
打卡-最长回文子串
最长回文子序列
Manacher算法
最长回文子串问题—Manacher算法
LeetCode 第647题：回文子串
C语言实现求最长回文子串
Manacher's Algorithm算法分析Java
Manacher 算法学习笔记

问题定义

最长回文子串问题：给定一个字符串，求它的最长回文子串长度。

解法1：暴力解法

找到字符串的所有子串，判断每一个子串是否是回文串。
一个子串有该串的起点和终点确定，因此对于长度为N的字符串共有 N²个子串，这些子串的平均长度为N/2 (判断是否是回文串的时间复杂度O(N)). 因此时间复杂度O(N³)

解法2：改进暴力解法

所有的回文串都是关于某个位置对称。
长度为奇数回文串以最中间字符的位置为对称轴左右对称；
长度为偶数的回文串以中间两个字符之间的空隙为对称轴左右对称。

我们可以遍历字符串中的这些位置, 从每个位置同时向左右扩展，直到两边的字符不同，或达到边界。这类位置共 N + N-1 = 2N-1个，且在每个位置上大约要进行N/4次字符比较，因此算法复杂度O(N²)

解法3：Mancher算法

解法2存在的缺陷：

存在很多子串被多次重复访问比较的情况
回文串的长度的奇偶性，造成不同的对称轴位置，解法2需要分别处理

步骤1：解决因回文串的长度的奇偶性需要分别处理对称轴的问题

方法：在字符串的开头和末尾，以及每两个字符的中间位置插入唯一标识符#.
这样构造字符串后，字符串的长度始终是奇数。例如，

aba ==> #a#b#a#
abba ==> #a#b#b#a#

步骤2：解决子串多次重复访问的问题

为了最大程度的利用已经访问过的回文串的信息， Manacher算法巧妙的定义了回文半径: 即，回文串最左或最右位置到对称轴的距离。
回文半径数组RL, RL[i]表示以第 i 个字符为对称轴的回文串的回文半径。例如，

Paste_Image.png

RL[i]值的性质：RL[i]-1 表示原始字符串中以第 i 个位置为对称轴的最长回文串长度。
证明：
在改造过的字符串中，以第 i 个位置为对称轴的回文串的最左和最右字符一定是 #.
第i个位置对应的字符，分两种情况，（如图1）:

第i个位置对应的字符是 #，则回文串共有奇数个字符，从回文串的最左位置到第i个位置共有，(RL[i]-1)/2 个非#字符， (RL[i] - (RL[i]-1)/2)个#字符，由于左右关于第 i 个位置对称，因此,该回文串中非#字符共有 (2 * (RL[i]-1)/2) = (RL[i]-1)个非#字符。
第i个位置对应的字符是非#字符，则回文串共有偶数个字符，从回文串的最左位置到第i个位置共有，RL[i]/2-1 个非#字符 (减1是为了不计算第 i 个位置的字符)， (RL[i] - RL[i]/2+1)个#字符，由于左右关于第 i 个位置对称，因此,该回文串中非#字符共有 (2 * (RL[i]/2-1)) + 1 = (RL[i] - 1)个非#字符（最后的+1，是将第 i 个位置也算上）。

图1

步骤3：如何利用RL数组，减少重复访问字符串

为了尽可能的减少重复访问字符串的次数，引入变量 MaxRigth 表示 在从左到右，已经访问过的回文串中，回文串所能触及到字符串的最右位置，即该回文串的中心为pos，则其关系如下图2所示：

图2

idx在4和12之间的所有字符都关于pos位置对称！

由于pos是已经访问过的位置，则 当前访问到的位置 i 只能位于pos的右边，且有两种情况：

1）当前访问的位置 i 在MaxRight的左边，如图3所示

图3

从图中可以看出，以位置 i 为中心的回文串必然与以pos为中心的回文串存在一部分的重合。

现在我们想找出以位置 i 为中心的回文字符，为了减少重复访问字符，我们希望可以知道以位置 i 为中心的左右两边哪些字符已经是对称的。

我们知道，以pos为中心的左右两边对称，位置 i 在pos的右边，那么在pos的左边必然存在和位置 i 对称的位置（假设我们记该对称的位置为 j）。如图3中的idx=6 。

由于位置 j 已经访问过，我们知道以位置 j 为中心的回文串回文半径, 此处分两种情况讨论：

以位置 j 为中心的回文串在位置pos和位置Maxright的对称位置之间，如图4所示.

图4

如图所示，由于以位置 j 为对称轴的回文串的回文半径已知，根据对称性，我们知道位置 i 的左右邻居对称，因此可以从左右邻居开始寻找以位置 i 为对称抽的回文串，这样便减少了对字符的重复访问。

以位置 j 为中心的回文串不在位置pos和Maxright的对称位置之间，如图5所示.

图5

此时我们只能确定红色线条之间字符关于位置 i 对称，但这也减少了重复访问字符的次数。此时，只需要从左红线的左端，右红线的右端开始遍历字符、判断对称，寻找最长回文字符。

2）当前访问的位置 i 在 MaxRight的右边，如图6。

图6

此时，说明以位置 i 为对称轴的回文串的左右两侧的对称信息，无法从历史信息中推导出来，我们不得不从位置 i 的左右邻居开始判断是否相同，指定遇到不同的字符或达到边界为止。

步骤4：如何更新RL数组, MaxRight变量，位置pos

if(i < MaxRight){
    // RL[i] 初始值
    RL[i] = min(RL[pos - (i -  pos], MaxRight-i)
}else {
    // RL[i] 初始值
    RL[i] = 1;
}

以位置 i 为对称轴 从对称轴的左右RL[i]距离处，同时向左右开始访问字符，并同时更新RL[i]

MaxRight = RL[i]+i-1 > MaxRight ? RL[i]+i-1 : MaxRight

pos =  RL[i]+i-1 > MaxRight ? i : pos;

算法实现

public int findLongestPalindromicSubstring(String s){
        // 填充字符, 假设字符#在s中没有出现过
        String cs = "#";
        for(int i=0; i<s.length(); ++i){
            cs += s.charAt(i);
            cs += "#";
        }

        // 保存最长的回文字符串的长度
        int maxlen = 0;
        int[] RL = new int[cs.length()];
        int maxRight=0, pos=0;

        for(int i=0; i<cs.length(); ++i){
           // 根据 i 位于maxRight的左边还是右边更新RL[i]
            if(i < maxRight){
                // i 在maxRight左边的情况
                RL[i] = Math.min(RL[2*pos-1], maxRight-i);
            }else{
                // i 在maxRight右边的情况
                RL[i]=1;
            }
            // 边界判断, 回文判断
            while(i+RL[i]<cs.length() && i-RL[i] >=0 && cs.charAt(i+RL[i])==cs.charAt(i-RL[i])){
                ++RL[i];
            }

            if(RL[i]+i-1 > maxRight){
                maxRight = RL[i] + i -1;
                pos = i;
            }

            // 更新最长回文字符串的长度
            maxlen = maxlen > RL[i] ? RL[i] : maxlen;
        }
        // 利用RL的性质
        return maxlen-1;
    }

复杂度分析

空间复杂度：插入分隔符形成新串，占用了线性的空间大小；RL数组也占用线性大小的空间，因此空间复杂度是线性的。
时间复杂度：尽管代码里面有两层循环，通过平摊分析，我们可以得出，Manacher的时间复杂度是线性的。由于内层的循环只对尚未匹配的部分进行，因此对于每一个字符而言，只会进行一次，因此时间复杂度是O(n)。

注：文本主要参考了文献[1]，并在理解的基础上，做了些许更改。

参考文献

[1] https://segmentfault.com/a/1190000003914228

最长回文子串
最长回文子串——Manacher 算法 1. 问题定义最长回文字符串问题:给定一个字符串，求它的最长回文子串长度...
字符串算法
最长公共前缀最长回文串最长回文子序列最长公共子串反转单词顺序列反转字符串字符串转数字 IP-int互转
打卡-最长回文子串
最长回文子串(中等)
最长回文子序列
该问题区别于最长回文子串，子串必须是连续的，而子序列则可以跳跃，例如AABCAA的最长回文子串为AA，但是它的最长...
Manacher算法
最长回文子串问题# 给定一个字符串，找出最长的回文子串，如"waabwswbfd",则最长子串为bwsb. 中心试...
最长回文子串问题—Manacher算法
最长回文串问题是一个经典的算法题。 0. 问题定义最长回文子串问题：给定一个字符串，求它的最长回文子串长度。如果...
LeetCode 第647题：回文子串
1、前言 2、思路此题与最长回文子串很像，只不过那个是求最长的回文子串，而这个是求回文子串的数目。但是他们的解法...
C语言实现求最长回文子串
最长回文子串的概念回文串是指正序和反序都一样的字符串，例如：Str1 = "AbbA"，则Str1的最长回文子串...
Manacher's Algorithm算法分析Java
Manacher's Algorithm俗称马拉车算法，对于求字符串中最长回文子串效率极高。在求最长回文子串的时...
Manacher 算法学习笔记
前言给定一个字符串，求出其最长回文子串。例如：s="abcd"，最长回文长度为 1；s="ababa"，最长回文...

最长回文子串

问题定义

解法1：暴力解法

解法2：改进暴力解法

解法3：Mancher算法

步骤1：解决因回文串的长度的奇偶性需要分别处理对称轴的问题

步骤2：解决子串多次重复访问的问题

步骤3：如何利用RL数组，减少重复访问字符串

步骤4：如何更新RL数组, MaxRight变量，位置pos

算法实现

复杂度分析

参考文献

相关文章

最长回文子串

字符串算法

打卡-最长回文子串

最长回文子序列

Manacher算法

最长回文子串问题—Manacher算法

LeetCode 第647题：回文子串

C语言实现求最长回文子串

Manacher's Algorithm算法分析Java

Manacher 算法学习笔记

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读