美文网首页
10. 正则表达式匹配

10. 正则表达式匹配

作者: 简_爱SimpleLove | 来源:发表于2021-03-27 00:48 被阅读0次

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

  • '.' 匹配任意单个字符
  • '*' 匹配零个或多个前面的那一个元素

所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

示例 1:
输入:s = "ab" p = "."
输出:true
解释:".
" 表示可匹配零个或多个('*')任意字符('.')。

示例 2:
输入:s = "aab" p = "cab"
输出:true
解释:因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。

解法

这个题确实比较难,自己昨天没看答案,花了好几个小时也没有做出来,总有最后几个通过不了测试。也想过用动态规划来做,但是不知道怎么推出动态转移方程,所以采用了双指针的做法,但是没有做出来。

力扣的官方答案不太好理解,最后还是参考了力扣的一个精选视频,才完全搞懂,以后碰到不好推出动态转移方程的,可以直接弄一张表,自己先填写一下,填着填着就能发现规律了。

填写完成过后的截图

代码如下,附有详细的注释,结合着这张图看代码一定会瞬间明白的:

def isMatch2(s, p):
    m, n = len(s), len(p)
    # 初始化二维数组,以 " "+p 为行的头,以" "+s为列的头
    # 如果s和p完全匹配,那么它们两个头部加上一个" "空字符也同样匹配
    # 之所以加一个空字符,是为了方便初始化,即第一行即为初始条件
    dp = [[False] * (n + 1) for _ in range(m + 1)]
    dp[0][0] = True  # 最左上角,因为都是两个空串,所以匹配,为True

    # 初始化p与空串的匹配,即先填写第一行,初始条件
    for col in range(1, n + 1):
        # 即从p的第二位开始
        if col > 1:
            # 如果当前为*号,那么它的状态值就等于左边第二位的状态值
            # 因为前面加了一个空字符,所以p的当前字符下标都要减1,s与p相同
            if p[col - 1] == "*":
                dp[0][col] = dp[0][col - 2]
            else:
                dp[0][col] = False
        else:
            # 这里其实是col等于1的时候,也就是p的第一位字符
            # 因为p不会以"*"或者" "开头,所以肯定不会走到这个else里面来
            # dp[0][1]肯定等于False,这个else可以省略
            if p[col - 1] == "*":
                dp[0][col] = True

    # 开始填表,从dp[1][1]开始每行每行的开始填表
    for row in range(1, m + 1):
        for col in range(1, n + 1):
            # 如果p的当前字符为"."或者等于s的当前字符
            # 那么它的状态值就取决于它左上角的状态值
            # 而且p的当前字符肯定不为"*"
            if p[col - 1] == s[row - 1] or p[col - 1] == ".":
                dp[row][col] = dp[row - 1][col - 1]
            elif p[col - 1] == "*":  # p的当前字符为"*"的情况下
                # 因为"*"不可能出现在p的第一位,所以其实下面的col>1的判断可以省略
                if col > 1:
                    # 当p的当前位为"*"号时,如果p的当前左边第二位也和s的当前位匹配,那么p的当前位也匹配
                    # 也就是 "*"前面字符出现0次的情况
                    if dp[row][col - 2]:
                        dp[row][col] = True
                    # 如果p当前的前一位字符为"."或者等于s的当前字符
                    # 那么当前位置的状态就等于它上面第一个位置的状态
                    # 这也是 "*"前面字符出现多次的情况
                    elif p[col - 2] in {s[row - 1], "."}:
                        dp[row][col] = dp[row - 1][col]

    # 返回填表后最右下角的值,即为整个p和s的匹配情况
    return dp[m][n]
复杂度分析
  • 时间复杂度:O(mn),其中 m 和 n 分别是字符串 s 和 p 的长度。我们需要计算出所有的状态,并且每个状态在进行转移时的时间复杂度为O(1)。因为我们是从dp[1][1]开始填的,所以时间复杂度还是O(mn)。
  • 空间复杂度:O((m+1)(n+1)),即为存储所有状态使用的空间。因为s和p前面都加了一个空字符,所以空间复杂度是O((m+1)(n+1))。

力扣官方答案

相关文章

网友评论

      本文标题:10. 正则表达式匹配

      本文链接:https://www.haomeiwen.com/subject/qdzshltx.html