PHP 正则表达式 详细讲解如何提取两个字符串之间的字符(支持单个&多个)

前言:

开发的时候有时需要提取一个长字符串里面的部分字符,常用于变量的查询、替换等。

场景:

假如我有一个hiveSQL语句,需求为:将变量{@date}替换成具体的日期,如20200526,

select 
  "F" as sex, 
  c.moviename as name, 
  avg(a.rate) as avgrate, 
  count(c.moviename) as total 
from 
  t_rating a 
  join t_user b on a.userid = b.userid 
  join t_movie c on a.movieid = c.movieid 
where 
  b.sex = "F" 
  and a.dt = {@date} 
  and b.dt = {@date } 
group by 
  c.moviename 
having 
  total >= 50 
order by 
  avgrate desc 
limit 
  10;

解决思路:

如上SQL里面不同用户写{@date}的格式不同,有点用户写法存在部分空格如{@date },情况很多,假如我们以此列举出来很繁琐,代码执行效率很低,那么该如何解决呢?这个时候想到的最优解应该是利用强大的正则匹配来解决此类问题;

解决方法:

利用正则检索的方法,正则为:

$regex = '/\{\s*([\w\W]*?)\s*\}/';
preg_match_all($regex, $sql . " ", $matches);

正则解释:
\s*表示任意的空白符,其中*为匹配前面的子表达式零次或多次,为贪婪模式
*?非贪婪模式,遇到后面的字符后即停止执行
\w :匹配包括下划线的任何单词字符,等价于 [A-Z a-z 0-9_]
\W :匹配任何非单词字符,等价于 [^A-Z a-z 0-9_]

以上SQL{@date}变量替换日期方法例子如下:

/**
     * @date日期变量字符串格式化
     * @param  string $sql
     * @param  bool   $date
     * @return mixed
     */
    public static function dateFormat($sql, $date = false)
    {
        //正则取出全部含有@date字符串的{}
        $regex = '/\{\s*([\w\W]*?)\s*\}/';
        preg_match_all($regex, $sql . " ", $matches);

        if (!empty($matches[0])) {
            foreach ($matches[0] as $string) {
                if (stristr($string, '@date')) {

                    //去除字符串空格
                    $cleanString = str_replace(' ', '', $string);

                    //若传参$date存在,则替换变量为具体@date值
                    if ($date) {
                        if ($cleanString == '{@date}') {
                            $cleanString = $date;
                        }

                        $sql = str_replace($string, $cleanString, $sql);
                    }
                }
            }
        }
        return $sql;
    }

 

另外,针对于简单的单个字符串提取可以使用以下方法:

//提取{}里面的字符串
preg_match
('/{.*}/',$sql,$match); echo $match[0];

 

posted @ 2020-05-26 20:31  申文哲  阅读(4945)  评论(2编辑  收藏  举报