随笔分类 - 正则表达式
摘要:注释语法:(?#comment),这个语法的内容会被正则忽略,用于注释含义。可以放在正则表达式的任意位置。文章参考:https://www.w3cschool.cn/rxoyts/l17fcozt.html
阅读全文
摘要:平衡组用于匹配嵌套层次结构,常用于匹配HTML标签(当HTML内容不规范,起始标签和结束标签数量不同时,匹配出正确配对的标签),在此把表达式统一以\w为例。(?'group'\w) 捕获的分组(\w匹配到的内容)命名为group,并压入堆栈(?'-group'\w) ...
阅读全文
摘要:在表达式里插记号的方式来启用绝大多数的模式,在正则的哪里插入,就从哪里启用。(?i):忽略大小写(CASE_INSENSITIVE)(?x):忽略空格字符(COMMENTS)(?s):.匹配任意字符,包括换行符(DOTALL)(?m):多行模式(MULTILINE)(...
阅读全文
摘要:贪婪:匹配尽可能长的字符串懒惰:匹配尽可能短的字符串懒惰模式的启用只需在重复元字符之后加?既可。*? 重复任意次,但尽可能少重复+? 重复1次或更多次,但尽可能少重复?? 重复0次或1次,但尽可能少重复{n,m}? 重复n到m次,但尽可能少重复{n,}? 重复n次以上...
阅读全文
摘要:后面的表达式可以引用前面的某个分组,用\1表示,就好像分组1的值赋值给了\1这个变量,这个变量可以在后面任意位置引用。\1 表示分组1匹配的文本\k 表示分组Word匹配的文本匹配重复两个的英文,例如匹配Hello Hello、lei123 lei123:(\w+)\...
阅读全文
摘要:在这里我把表达式统一以\w为例:(\w) 被一个括号包围起来是一个整体,表示一个分组(\w)(\w) 自动命名分组,第一个小括号是分组1,第二个小括号是分组2(?'Word'\w+)) 表示定义了一个叫做Word的分组(?\w+)) 表示定义了一个叫做Word的分组(...
阅读全文
摘要:又叫逻辑运算符,在此X和Y表示两个表达式XY X紧跟YX|Y 表示X或Y,从左到右,满足第一个条件就不会继续匹配了。文章参考:https://www.w3cschool.cn/rxoyts/l17fcozt.html
阅读全文
摘要:表示不属于元字符或者字符类的字符反义元字符\W 匹配任意不是字母,数字,下划线,汉字的字符\S 匹配任意不是空白符的字符\D 匹配任意非数字的字符\B 匹配不是单词开头或结束的位置反义字符类[^x] 匹配除了x以外的任意字符[^aeiou] 匹配除了aeiou这几个字...
阅读全文
摘要:当需要匹配明确的字符或字符集合时候,就用到字符类。特殊字符\0hh 8进制值hh所表示的字符\xhh 16进制值hh所表示的字符\uhhhh 16进制值hhhh所表示的Unicode字符\t Tab\n 换行符\r 回车符\f 换页符\e Escape\cN ASCI...
阅读全文
摘要:如果想匹配元字符本身或者正则中的一些特殊字符,使用\转义。例如匹配*这个字符则使用\*,匹配\这个字符,使用\\。需要转义的字符:$, (, ), *, +, ., [, ], ?, \, ^, {, }, |文章参考:https://www.w3cschool.cn...
阅读全文
摘要:元字符,又叫字符集,就是用一些特殊符号表示特定种类的字符或位置。匹配字符. 匹配除换行符以外的任意字符\w 匹配字母或数字或下划线或汉字\s 匹配任意的空白符\d 匹配数字匹配位置 匹配单词的开始或结束^ 匹配字符串的开始$ 匹配字符串的结束\G 上一个匹配的结尾(本...
阅读全文
摘要:正则表达式 - 语法正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。列目录时,dir *.txt或ls *.txt中的*.txt就不是一个正则表...
阅读全文
摘要:正则表达式 - 简介除非您以前使用过正则表达式,否则您可能不熟悉此术语。但是,毫无疑问,您已经使用过不涉及脚本的某些正则表达式概念。例如,您很可能使用 ? 和 * 通配符来查找硬盘上的文件。通配符匹配文件名中的单个字符,而 * 通配符匹配零个或多个字符。像 data?...
阅读全文
浙公网安备 33010602011771号