美文网首页
LeetCode #72: Edit Distance

LeetCode #72: Edit Distance

作者: Branch | 来源:发表于2017-06-20 17:38 被阅读0次

Problem

Given two words word1 and word2, find the minimum number of steps required to convert word1 to word2. (each operation is counted as 1 step.)

You have the following 3 operations permitted on a word:

a) Insert a character
b) Delete a character
c) Replace a character

题意

对于给定两个单词word1和word2,你可以对word1进行以下3种操作:

a) 插入一个字母
b) 删除一个字母
c) 替换一个字母

请计算将word1变换成word2的最少操作数。

分析

此题是一个非常典型动态规划问题,里面涉及到一个概念(即本题的题目):编辑距离

编辑距离
两个字符串的各种对齐所可能具有的最小代价。
即,它可以被视为将一个字符串变换为另一个字符串所需最小编辑操作,包括插入、删除以及字符替换的次数。

用动态规划思想解决

如何划分子问题

  • 有两个字符串x[1...n],y[1...m]
  • 考虑两个字符串的长度各自为i和j的前缀x[1...i],y[1...j]
  • 对于x[i]和y[j]的最佳对齐(最佳对齐是指,为得到全局最优解而取的局部最优解),有以下可能的三种情况:
三种对齐方式(- 代表一个空隙)

对空格及编辑代价的解释
当两个字符串不相同时,想要对齐它们,可以写成如下形式(以SNOWY和SUNNY为例):

代价为3

代价为5
其中,-表示一个空隙,对齐时,可以将它随意插入到每个字符串中。对于一种对齐方式,其代价是指上下字符串对应字母不相同的列数。而编辑距离是指两个字符串的各种对齐所可能具有的最小代价。
利用二维矩阵

以exponential和polynomial为例,结合我们上面谈到的对两个字符串中的两个字符进行对齐,算出其代价,可得到如下的二维矩阵:

其中,(i, j) = min(1 + (i - 1, j), 1 + (i, j - 1), diff(w1[i], w2[j]) + (i - 1, j - 1))

该算法的伪代码:

伪代码

参考资料
《算法概论》/《Algorithm》 - Sanjoy Dasgupta著;
第六章 动态规划:6.3 编辑距离

Code

//Runtime: 12ms
class Solution {
public:
    int diff(char a, char b){
        return !(a == b);
    }
    int min(const int& a, const int& b, const int& c){
        int tmp = a < b ? a : b;
        return (tmp < c ? tmp : c);
    }

    int minDistance(string word1, string word2) {
        if(word1.size() == 0 && word2.size() == 0)
            return 0;
        if (word1.size() == 0 && word2.size() != 0)
            return word2.size();
        if (word2.size() == 0 && word1.size() != 0)
            return word1.size();
        
        vector<vector<int>> matrix;
        matrix.resize(word1.size() + 1);
        for (int i = 0; i <  word1.size(); i++)
            matrix[i].resize(word2.size() + 1);
        matrix[0][0] = 0;

        for (int i = 1; i < word1.size() + 1; i++)
            matrix[i][0] = matrix[i - 1][0] + 1;
        for (int j = 1; j < word2.size() + 1; j++)
            matrix[0][j] = matrix[0][j - 1] + 1;

        for (int i = 1; i < word1.size() + 1; i++)
            for (int j = 1; j < word2.size() + 1; j++){
                matrix[i][j] = min(1 + matrix[i - 1][j], 
                                   1 + matrix[i][j - 1], 
                                   diff(word1[i - 1], word2[j - 1]) + matrix[i - 1][j - 1]);
            }
        
        return matrix[word1.size()][word2.size()];
    }
};

相关文章

网友评论

      本文标题:LeetCode #72: Edit Distance

      本文链接:https://www.haomeiwen.com/subject/euhaqxtx.html