美文网首页动态规划
10. Regular Expression Matching

10. Regular Expression Matching

作者: RobotBerry | 来源:发表于2017-05-10 13:05 被阅读50次

问题

Implement regular expression matching with support for '.' and '*'.

'.' Matches any single character.
'*' Matches zero or more of the preceding element.

The matching should cover the entire input string (not partial).

The function prototype should be:
bool isMatch(const char *s, const char *p)

例子

isMatch("aa","a") → false
isMatch("aa","aa") → true
isMatch("aaa","aa") → false
isMatch("aa", "a*") → true
isMatch("aa", ".*") → true
isMatch("ab", ".*") → true
isMatch("aab", "c*a*b") → true

分析

首先要理解正则表达式的规则:

  • '.'代表任意字符,不可为空字符;
  • '*'表示前一个字符重复n次,n>=0.

按照定义,'*'之前必须要有一个字符。

考虑使用动态规划:

  1. 状态表
    dp[i][j],表示s[0, i - 1]和p[0, j - 1]是否匹配

  2. 初始状态
    dp[0][0] = true s为空,p为空,必然匹配;
    dp[i][0] = false, i >= 1 s非空,p为空,必然不匹配;
    dp[0][j] = j > 1 && p[j - 1] == '*' && dp[0][j - 2], j >= 1
    注:s为空。当p的长度为1时,必然不匹配(不管是'*', '.'还是其他字符);当p的长度大于1时,s和p[0, j - 1]匹配的充要条件是p[j - 1] = '*',并且dp[0][j - 2]为true. 举个例子,长度为n的p可以被表示为p[0, j - 3]a*p[j, n],其中p[j - 1] = '*',p[j - 2] = 'a'。那么p[0, j - 3]a*和s匹配的唯一条件就是p[0, j - 3]和s匹配,也就是dp[0][j - 2]为true.

  3. 状态转移方程
    dp[i][j] = dp[i - 1][j - 1] && (s[i - 1] == p[j - 1] || p[j - 1] == '.'); if p[j - 1] != '*'
    dp[i][j] = dp[i][j - 2] || ((s[i - 1] == p[j - 2] || p[j - 2] == '.') && dp[i - 1][j]); if p[j - 1] == '*'
    注:dp[i][j] = dp[i][j - 2]指的是'*'重复了0次,即p[j - 2, j - 1]这段可以理解成空串;dp[i][j] = (s[i - 1] == p[j - 2] || p[j - 2] == '.') && dp[i - 1][j]指的是'*'重复了n(n>=1)次,(s[i - 1] == p[j - 2] || p[j - 2] == '.') && dp[i - 1][j]相当于重复了1次,然后从状态表中查找剩下的n-1次重复。

要点

dp

时间复杂度

O(mn)

空间复杂度

O(mn)

代码

class Solution {
public:
    bool isMatch(string s, string p) {
        int m = s.size(), n = p.size();
        vector<vector<bool>> dp(m + 1, vector<bool>(n + 1, false));
        dp[0][0] = true;
        for (int i = 1; i <= m; i++)
            dp[i][0] = false;
        for (int j = 1; j <= n; j++)
            dp[0][j] = j > 1 && p[j - 1] == '*' && dp[0][j - 2];
            
        for (int i = 1; i <= m; i++) 
            for (int j = 1; j <= n; j++)
                if (p[j - 1] != '*')
                    dp[i][j] = dp[i - 1][j - 1] && (s[i - 1] == p[j - 1] || p[j - 1] == '.');
                else
                    dp[i][j] = dp[i][j - 2] || ((s[i - 1] == p[j - 2] || p[j - 2] == '.') && dp[i - 1][j]);
        return dp[m][n];
    }
};

相关文章

网友评论

    本文标题:10. Regular Expression Matching

    本文链接:https://www.haomeiwen.com/subject/llzwtxtx.html