美文网首页刷穿 LeetCode
【刷穿 LeetCode】10. 正则表达式匹配(困难)

【刷穿 LeetCode】10. 正则表达式匹配(困难)

作者: 水三叶的刷题日记 | 来源:发表于2021-02-05 09:37 被阅读0次

    点击 这里 可以查看更多算法面试相关内容~

    题目描述

    给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.''*' 的正则表达式匹配。

    • '.' 匹配任意单个字符
    • '*' 匹配零个或多个前面的那一个元素

    所谓匹配,是要涵盖整个字符串 s 的,而不是部分字符串。

    示例 1:

    输入:s = "aa" p = "a" 
    输出:false
    解释:"a" 无法匹配 "aa" 整个字符串。
    

    示例 2:

    输入:s = "aa" p = "a*" 
    输出:true
    解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。
    因此,字符串 "aa" 可被视为 'a' 重复了一次。
    

    示例 3:

    输入:s = "ab" p = ".*"  
    输出:true
    解释:".*" 表示可匹配零个或多个('*')任意字符('.')。
    

    示例 4:

    输入:s = "aab" p = "c*a*b"
    输出:true
    解释:因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
    

    示例 5:

    输入:s = "mississippi" p = "mis*is*p*." 
    输出:false
    

    提示:

    • 0 <= s.length <= 20
    • 0 <= p.length <= 30
    • s 可能为空,且只包含从 a-z 的小写字母。
    • p 可能为空,且只包含从 a-z 的小写字母,以及字符 .*
    • 保证每次出现字符 * 时,前面都匹配到有效的字符

    动态规划解法

    整理一下题意,对于字符串 p 而言,有三种字符:

    • 普通字符:需要和 s 中同一位置的字符完全匹配
    • '.':能够匹配 s 中同一位置的任意字符
    • '*':不能够单独使用 '*',必须和前一个字符同时搭配使用,数据保证了 '*' 能够找到前面一个字符。能够匹配 s 中同一位置字符任意次。

    所以本题关键是分析当出现 a* 这种字符时,是匹配 0 个 a、还是 1 个 a、还是 2 个 a ...

    本题可以使用动态规划进行求解:

    • 状态定义:f(i,j) 代表考虑 s 中以 i 为结尾的子串和 p 中的 j 为结尾的子串是否匹配。即最终我们要求的结果为 f[n][m]

    • 状态转移:也就是我们要考虑 f(i,j) 如何求得,前面说到了 p 有三种字符,所以这里的状态转移也要分三种情况讨论:

      1. p[j] 为普通字符:匹配的条件是前面的字符匹配,同时 s 中的第 i 个字符和 p 中的第 j 位相同。 即 f(i,j) = f(i - 1, j - 1) && s[i] == p[j]

      2. p[j]'.':匹配的条件是前面的字符匹配, s 中的第 i 个字符可以是任意字符。即 f(i,j) = f(i - 1, j - 1) && p[j] == '.'

      3. p[j]'*':读得 p[j - 1] 的字符,例如为字符 a。 然后根据 a* 实际匹配 sa 的个数是 0 个、1 个、2 个 ...

        3.1. 当匹配为 0 个:f(i,j) = f(i, j - 2)

        3.2. 当匹配为 1 个:f(i,j) = f(i - 1, j - 2) && (s[i] == p[j - 1] || p[j - 1] == '.')

        3.3. 当匹配为 2 个:f(i,j) = f(i - 2, j - 2) && ((s[i] == p[j - 1] && s[i - 1] == p[j - 1]) || p[j] == '.')

        ...


        数学推导

    所有的状态转移都搞清楚之后,就可以写代码啦:

    class Solution {
        public boolean isMatch(String ss, String pp) {
            // 技巧:往原字符头部插入空格,这样得到 char 数组是从 1 开始,而且可以使得 f[0][0] = true,可以将 true 这个结果滚动下去
            int n = ss.length(), m = pp.length();
            ss = " " + ss;
            pp = " " + pp;
            char[] s = ss.toCharArray();
            char[] p = pp.toCharArray();
            // f(i,j) 代表考虑 s 中的 1~i 字符和 p 中的 1~j 字符 是否匹配
            boolean[][] f = new boolean[n + 1][m + 1];
            f[0][0] = true;
            for (int i = 0; i <= n; i++) {
                for (int j = 1; j <= m; j++) {
                    // 如果下一个字符是 '*',则代表当前字符不能被单独使用,跳过
                    if (j + 1 <= m && p[j + 1] == '*') continue;
                    
                    // 对应了 p[j] 为普通字符和 '.' 的两种情况
                    if (i - 1 >= 0 && p[j] != '*') {
                        f[i][j] = f[i - 1][j - 1] && (s[i] == p[j] || p[j] == '.');
                    } 
                    
                    // 对应了 p[j] 为 '*' 的情况
                    else if (p[j] == '*') {
                        f[i][j] = (j - 2 >= 0 && f[i][j - 2]) || (i - 1 >= 0 && f[i - 1][j] && (s[i] == p[j - 1] || p[j - 1] == '.'));
                    }
                }
            }
            return f[n][m];
        }
    }
    

    时间复杂度:n 表示 s 的长度,m 表示 p 的长度,总共 n * m 个状态。复杂度为 O(n * m)

    空间复杂度:使用了二维数组记录结果。复杂度为 O(n * m)

    动态规划本质上是枚举(不重复的暴力枚举),因此其复杂度很好分析,有多少个状态就要被计算多少次,复杂度就为多少。


    最后

    这是我们「刷穿 LeetCode」系列文章的第 No.10 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先将所有不带锁的题目刷完。

    在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

    由于 LeetCode 的题目随着周赛 & 双周赛不断增加,为了方便我们统计进度,我们将按照系列起始时的总题数作为分母,完成的题目作为分子,进行进度计算。当前进度为 10/1916

    为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:Github 地址 & Gitee 地址

    在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和一些其他的优选题解。

    </br>

    算法与数据结构

    LeetCode题解

    算法面试

    相关文章

      网友评论

        本文标题:【刷穿 LeetCode】10. 正则表达式匹配(困难)

        本文链接:https://www.haomeiwen.com/subject/ycqjtltx.html