正则表达式

摘要:这篇博客不推荐看。。。

 

--正则表达式

元字符:

1、. :匹配换行符之外的任意单个字符

2、[ ] :匹配括号中的任何一个字符

3、 | :将两个匹配条件进行逻辑“或运算”

4、$ :匹配行结束符

5、 \d :代表一个数字,等同于 [0-9]

6、 \D :代表非数字 ,等同于 [^0-9]

7、 \s :代表换行符、Tab制表符等空白字符

8、 \S :代表非空白字符

9、 \w :匹配字母或数字或下划线或汉字,不能匹配特殊符号

10、\W : 非\w


限定符:限定元字符出现的次数

1、 * :匹配0个至多个在它之前的子表达式 {0,}

2、 + :匹配前面的子表达式一次或多次 和*对比-->至少一次 {1,}

3、 ? :匹配前面的子表达式零次或一次 {0,1}

4、 {n} :匹配确定的 n次

5、 {n,} :至少匹配n次

6、 {n,m}:最少匹配n次且最多匹配m次

 

//运用
        //获取网页中的内容 
            WebClient web = new WebClient();
            byte[] buffer = web.DownloadData("网页.html");

            //将保留下的内容装换为字符串
            string content = Encoding.UTF8.GetString(buffer);    //读取成功

            string regex = @"[a-zA-Z0-9_]+@[0-9a-zA-Z]+(\.[a-zA-Z]+){1,3}";     //匹配邮箱的正则表达式     642525840@qq.con   或者   642525840@qq.com.cn

            //匹配成功的集合
            MatchCollection mc = Regex.Matches(content, regex);   //matches集合  match 单个

            foreach (Match item in mc)
            {
                if (item.Success)
                {
                    Console.WriteLine(item.Value);
                }
            }

 

posted @ 2018-02-21 22:31  蓝色标记  阅读(160)  评论(0编辑  收藏  举报