【算法4】5.3.4.子字符串查找-BoyerMoore算法

Boyer Moore 算法思想:将模式字符串与文本字符串从右往左进行匹配。

Boyer Moore 需要先对模式字符串进行预处理,根据模式字符串生成 right[] 数组,记录字符集中的字符在模式字符串中最右出现的位置。

当将模式字符串从右往左对比出现不匹配时,会有以下情况:

  • 文本字符 text.chatAt(i+j) 不在模式字符串中,需要将模式字符串右移到 text.chatAt(i+j) 之后
  • 文本字符 text.chatAt(i+j) 在模式字符串中,需要将模式字符串该字符出现的最右位置与该字对齐(要保证至少右移一个位置)
/*
 * Boyer Moore 算法
 * */
public class BoyerMoore {
    private static final int R = 256; // 字母表
    private int[] right; // 记录字符集中的字符在模式字符串中出现的最后位置,不存在则是 -1
    private String pattern;

    public BoyerMoore(String pattern) {
        right = new int[R];
        this.pattern = pattern;
        int M = pattern.length();
        for (int i = 0; i < R; i++) {
            right[i] = -1;
        }
        for (int i = 0; i < M; i++) {
            right[pattern.charAt(i)] = i;
        }
    }

    public int search(String text) {
        int M = pattern.length();
        int N = text.length();
        int skip;
        for (int i = 0; i <= N - M; i += skip) {
            skip = 0;
            for (int j = M - 1; j >= 0; j--) {
                if (text.charAt(i + j) != pattern.charAt(j)) {
                    skip = j - right[text.charAt(i + j)];
                    if (skip < 1) skip = 1; // 至少需要向右移动一个位置
                    break;
                }
            }
            if (skip == 0) {
                return i;
            }
        }
        return -1;
    }
}
posted @ 2022-06-04 13:47  廖子博  阅读(45)  评论(0)    收藏  举报