10 正则表达式匹配(LeetCode HOT 100)

描述:
给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

  • '.' 匹配任意单个字符
  • '*' 匹配零个或多个前面的那一个元素

所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

示例 1:

输入:s = "aa", p = "a"
输出:false
解释:"a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:s = "aa", p = "a*"
输出:true
解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。

示例3:

输入:s = "ab", p = ".*"
输出:true
解释:".*" 表示可匹配零个或多个('*')任意字符('.')。

提示:

  • 1 <= s.length <= 20
  • 1 <= p.length <= 30
  • s 只包含从 a-z 的小写字母。
  • p 只包含从 a-z 的小写字母,以及字符 . 和 *。
  • 保证每次出现字符 * 时,前面都匹配到有效的字符

Soulution:

public class L10IsMatch {
    public static void main(String[] args) {
        // false
        System.out.println(isMatch("aa","a"));
        // true
        System.out.println(isMatch("aa", "a*"));
        // true
        System.out.println(isMatch("aa",".*"));
        // true
        System.out.println(isMatch("aab","c*a*b"));
        // false
        System.out.println(isMatch("mississippi","mis*is*p*."));
        // true
        System.out.println(isMatch("aaa", "a*a"));
        // true
        System.out.println(isMatch("aaa", "ab*a*c*a"));
        // false
        System.out.println(isMatch("bbab", "b*a*"));
    }

    /**
     * 匹配
     */
    private static boolean matched = false;
    /**
     * 正则表达式
     */
    private static char[] pattern;
    /**
     * 正则表达式长度
     */
    private static int plen;

    /**
     * 正则表达式(回溯思想)
     *
     * @param s 待匹配字符串
     * @param p 正则表达式串
     * @return boolean
     */
    public static boolean isMatch(String s, String p) {
        matched = false;
        pattern = p.toCharArray();
        plen = p.length();
        rmatch(0, 0, s.toCharArray(), s.length());
        return matched;
    }

    private static void rmatch(int ti, int pj, char[] text, int tlen) {
        if (matched) {
            return;
        }
        // 正则表达式到尾了
        if (pj == plen) {
            // 文本串也到尾部了
            if (ti == tlen) {
                matched = true;
            }
            return;
        }
        if (pj + 1 < plen && pattern[pj + 1] == '*') {
            // 匹配任意多个字符pre
            char pre = pattern[pj];
            // 匹配零个,无需关注字符pre到底是什么,pj+2,是因为*与其前一个字符构成特殊通配符,需一起跳过
            rmatch(ti, pj + 2, text, tlen);
            // 匹配多个,继续匹配前,需对比pre与当前元素是否相同
            for (int k = 1; k <= tlen - ti; ++k) {
                // ti是我们当前要对比的元素,假设从ti开始有2个字符与pre相同,text[ti],text[ti+1]
                // 所以在循环中,我们要对比的就是这两个元素,又因为k从1开始,所以需要减1
                if (pre == text[ti + k -1] || pre == '.') {
                    rmatch(ti + k, pj + 2, text, tlen);
                } else {
                    break;
                }
            }
        } else if (pattern[pj] == '.') {
            // 匹配任意一个字符
            rmatch(ti + 1, pj + 1, text, tlen);
        } else if (ti < tlen && pattern[pj] == text[ti]) {
            // 纯字符匹配
            rmatch(ti + 1, pj + 1, text, tlen);
        }
    }
}

Idea:

首先,读题"保证每次出现字符时,前面都匹配到有效的字符",这就意味着,字符和前一个字符构成一个特殊通配符。
所以,一共有三种字符,普通字符,单个字符通配符,特殊通配符。

我们一次考察正则表达式中的每个字符,当是非通配符时,我们就直接跟文本的字符进行匹配。
如果相同,则继续往下处理;如果不同,则回溯。
如果遇到特殊字符的时候,我们就有多种处理方式了,也就是所谓的岔路口,
比如"x*"有多种匹配方案,可以匹配任意多个字符x,我们就先随意的选择一种匹配方案
然后继续考察剩下的字符,如果中途发现无法继续匹配下去,我们就回到这个岔路口,
重新选择一种匹配方案,然后再继续匹配下去。

Reslut:

Impore:
可以使用动态规划进行优化!待补充!

posted @ 2022-04-07 21:57  supermingjun  阅读(38)  评论(0编辑  收藏  举报