美文网首页
[LeetCode]10、正则表达式匹配

[LeetCode]10、正则表达式匹配

作者: 河海中最菜 | 来源:发表于2019-07-27 14:07 被阅读0次

    题目描述

    给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

    '.' 匹配任意单个字符
    '*' 匹配零个或多个前面的那一个元素
    所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

    说明:

    s 可能为空,且只包含从 a-z 的小写字母。
    p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
    示例 1:

    输入:
    s = "aa"
    p = "a"
    输出: false
    解释: "a" 无法匹配 "aa" 整个字符串。
    示例 2:

    输入:
    s = "aa"
    p = "a"
    输出: true
    解释: 因为 '
    ' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
    示例 3:

    输入:
    s = "ab"
    p = "."
    输出: true
    解释: ".
    " 表示可匹配零个或多个('*')任意字符('.')。
    示例 4:

    输入:
    s = "aab"
    p = "cab"
    输出: true
    解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
    示例 5:

    输入:
    s = "mississippi"
    p = "misisp*."
    输出: false

    思路:

    • 递归
      如何处理‘.’,任意匹配
      如何处理“*”,不匹配,或者匹配多个前面的字符
      容易超时
    • 动态规划
      通过注释解释
    class Solution:
        def isMatch(self, text, pattern):
            if not pattern:
                return not text
            first = text and pattern[0] in [text[0], "."]
            if len(pattern) >= 2 and pattern[1] == "*":
                return self.isMatch(text, pattern[2:]) or (first and self.isMatch(text[1:], pattern))
            return first and self.isMatch(text[1:], pattern[1:])
    

    动态规划代码:

    class Solution:
        '''
        给定一个字符串 (s) 和一个字符模式 (p)。实现支持 '.' 和 '*' 的正则表达式匹配。
            '.' 匹配任意单个字符。
            '*' 匹配零个或多个前面的元素。
        匹配应该覆盖整个字符串 (s) ,而不是部分字符串。
        s 可能为空,且只包含从 a-z 的小写字母。
        p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *
    
        参考: https://blog.csdn.net/hk2291976/article/details/51165010
        '''
    
        def isMatch(self, s: str, p: str) -> bool:
            '''
            p.charAt(j) == s.charAt(i) : dp[i][j] = dp[i-1][j-1]
            If p.charAt(j) == '.' : dp[i][j] = dp[i-1][j-1];
            If p.charAt(j) == '*': here are two sub conditions:
            //in this case, a* only counts as empty, otherwise is not match
            - if p.charAt(j-1) != s.charAt(i) : dp[i][j] = dp[i][j-2]
            - if p.charAt(j-1) == s.charAt(i) or p.charAt(i-1) == '.':
                dp[i][j] = dp[i-1][j]    //in this case, a* counts as multiple a
                dp[i][j] = dp[i][j-1]   // in this case, a* counts as single a
                dp[i][j] = dp[i][j-2]   // in this case, a* counts as empty
    
            思路: 动态规划, 沿着匹配串和字符串构成矩阵的对角线传递状态
            1. 状态矩阵的首行与首列对应于空字符与空匹配符
            2. 对角线意味着匹配串是否匹配对应的字符串
            '''
            ns = len(s)
            np = len(p)
    
            dp = [[False] * (np + 1) for _ in range(ns + 1)]
            dp[0][0] = True
            # 匹配空字符串的情况, 匹配串为空时已经为False, 不再更新
            for i in range(np):
                # 根据规则, *前必存在一个字符, 则当前为*时, 其状态与前2的状态一致
                if p[i] == '*' and dp[0][i - 1]:
                    dp[0][i + 1] = True
            # 更新状态矩阵
            for i in range(1, ns + 1):
                for j in range(1, np + 1):
                    # i,j是矩阵的行与列, 对应到匹配串和字符串的索引要-1
                    # 匹配串与字符串匹配(相等或为.)传递状态
                    if p[j - 1] == s[i - 1] or p[j - 1] == '.':
                        dp[i][j] = dp[i - 1][j - 1]
                    # 匹配串中 * 字符特殊处理
                    elif p[j - 1] == '*':
                        # 根据匹配规则, 比较匹配串*的前一个字符与字符串中前一个字符
                        # 二者不相等时, a*只有作为空字符串时才可能匹配,
                        # 这就是说, 略过前一个字符, *字符对应的状态与字符串中前2个字符的状态一致
                        if p[j - 2] != s[i - 1]:
                            dp[i][j] = dp[i][j - 2]
                        # 二者相等时有三种情况
                        # a*作为: 空字符, 单字符 a, 多字符 aaa...
                        if p[j - 2] == s[i - 1] or p[j - 2] == '.':
                            dp[i][j] = dp[i][j - 2] or dp[i][j - 1] or dp[i - 1][j]
            return dp[ns][np]
    
    AC10动态规划

    相关文章

      网友评论

          本文标题:[LeetCode]10、正则表达式匹配

          本文链接:https://www.haomeiwen.com/subject/wizsrctx.html