美文网首页
计算字符串距离

计算字符串距离

作者: simon_kin | 来源:发表于2021-02-17 22:48 被阅读0次

题目描述

Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。

Ex:
字符串A:abcdefg
字符串B: abcdef
通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。
要求:
给定任意两个字符串,写出一个算法计算它们的编辑距离。

题解

  • 构建一个dp数组
    这里数组长度要在原始字符串长度加1 若长度为4字符串和长度为6字符串比较则需构建一个5行7列的dp数组
  • 边界条件
    当i=0 或 j=0时 字符串的距离就是改字符所在位置,即 j 或 i的值
  • 状态转移方程
    那么如果s1[i]==s2[j],显然不需要进行操作,dp[i][j]==dp[i-1][j-1];
    如果s1[i]!=s2[j],dp[i][j]就是取dp[i-1][j-1]、dp[i-1][j]、dp[i][j-1]最小值加1
d i s t i n
0 1 2 3 4 5 6
d 1 0 1 2 3 4 5
i 2 1 0 2 3 4 5
v 3 2 1 1 2 3 4
e 4 3 2 2 2 3 4

最后结果就是dp[i+1][j+1]

动态规划

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;

public class Main {
    public static void main(String[] args) throws IOException {
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
        String str;
        while ((str = br.readLine()) != null) {
            String str1 = str;
            String str2 = br.readLine();
            
            System.out.println(mm(str1, str2));
        }
    }

    public static int mm(String str1, String str2) {
        int len1 = str1.length();
        int len2 = str2.length();
        int[][] dp = new int[len1+1][len2+1];
        int min = 0;
        for (int i = 0; i <= len1; i++) {
            for (int j = 0; j <= len2; j++) {
                if (i==0 || j==0){
                    dp[i][j] = Math.max(i,j);
                }else{
                    min = Math.min( dp[i-1][j-1], Math.min(dp[i-1][j],dp[i][j-1]));
                    if (str1.charAt(i-1) == str2.charAt(j-1)) {
                        dp[i][j] = dp[i-1][j-1];
                    } else {
                        dp[i][j] = min + 1;
                    }
                }
            }
        }
        return dp[len1][len2];
    }
}

相关文章

  • 计算字符串距离

    题目描述 Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次...

  • 动态规划求最小编辑距离

    我们需要去计算两个字符串之间的相似度,这个在拼写校正和在生物中计算蛋白质序列距离非常有用。 编辑距离定义 The ...

  • 编辑距离的原理与java实现

    基本介绍 Levenshtein距离是一种计算两个字符串间的差异程度的字符串度量(string metric)。我...

  • 文本相似度计算与展示

    文本相似度计算方法归类 基于字符串。该方法从字符串匹配度出发,以字符串共现和重复程序为相似度的衡量标准。如编辑距离...

  • 不等高Cell

    计算字符串一行的高度 计算字符串多行的高度

  • IOS计算字符串字节长度

    计算字符串字节长度:方法一 计算字符串字节长度:方法二

  • C代写 CSCE 155E:Homework 5代写留学生asp

    IntroductionC语言,实现基本的字符串操作函数和矩阵计算,包括字符串复制,字符串拼接,字符串比对,计算字...

  • iOS 计算字符串高度(宽)

    记录一下。。。。 计算字符串高度(宽) 计算字符串的高度注意事项: 字符串长度小于1时,应该返回0 计算得到的字符...

  • HJ52 计算字符串的距离

    描述Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许...

  • 算法刷题常用

    字符串 字符串长度 strlen计算长度时不计\0.sizeof()计算'\0' 由于字符串以'\0'结尾,定义一...

网友评论

      本文标题:计算字符串距离

      本文链接:https://www.haomeiwen.com/subject/cnqctltx.html