Knuth-Morris-Pratt 字符串查找算法,简称为 “KMP算法”,常用于在一个文本串S内查找一个模式串P 的出现位置,这个算法由Donald Knuth、Vaughan Pratt、James H. Morris三人于1977年联合发表,故取这3人的姓氏命名此算法。
下面先直接给出KMP的算法流程:
- 假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置
- 如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),都令i++,j++,继续匹配下一个字符;
- 如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = next[j]。此举意味着失配时,模式串P相对于文本串S向右移动了j - next [j] 位。
- 换言之,当匹配失败时,模式串向右移动的位数为:失配字符所在位置 - 失配字符对应的next 值(next 数组的求解会在下文的3.3.3节中详细阐述),即移动的实际位数为:j - next[j],且此值大于等于1。
文章详解参考:https://www.cnblogs.com/ZuoAndFutureGirl/p/9028287.html
代码:
package cn.algorithm.kmp;
import java.util.Arrays;
/**
* @Author smallmartial
* @Date 2019/7/1
* @Email smallmarital@qq.com
*/
public class KMPAlgorithm {
public static void main(String[] args) {
String str1 = "BBC ABCDAB ABCDABCDABDE";
String str2 = "ABCDABD";
// String str2 = "BBC";
int[] next = kmpNext("ABCDABD");
System.out.println(Arrays.toString(next));
int index = kmpSearch(str1,str2,next);
System.out.println("index = "+ index);
}
//写出kmp搜索算法
/**
*
* @param str1 源字符串
* @param str2 子串
* @param next 部分匹配表 是字串对应的部分匹配表
* @return 如果返回-1 则没有匹配到
*/
public static int kmpSearch(String str1, String str2,int[] next){
//遍历str1
for (int i = 0,j=0; i <str1.length() ; i++) {
//str1.charAt(i) != str2.charAt(j)
//kmp核心算法
while (j > 0 && str1.charAt(i) != str2.charAt(j)){
j = next[j -1];
}
if (str1.charAt(i) == str2.charAt(j)) {
j++;
}
if (j == str2.length()){
return i - j + 1;
}
}
return -1;
}
//获取一个字符串的部分匹配值
public static int[] kmpNext(String dest){
//创建一个next数组保存部分匹配值
int[] next = new int[dest.length()];
next[0] = 0;//如果字符串长度为1 部分匹配值就是0
for (int i = 1 ,j = 0; i < dest.length(); i++) {
//当dest.charAt(i) != dest.charAt(j) 满足时,我们需要从next[j-1]获取新的j
//直到我们发现有dest.charAt(i) == dest.charAt(j)成立才退出
while (j>0 && dest.charAt(i) != dest.charAt(j)){
j =next[j-1];
}
//当dest.charAt(i) == dest.charAt(j) 满足时,部分匹配值就是+1
if (dest.charAt(i) == dest.charAt(j)){
j++;
}
next[i]=j;
}
return next;
}
}
网友评论