摘要: 常用正则表达式大全!(例如:匹配中文、匹配html)匹配中文字符的正则表达式: [u4e00-u9fa5]   评注:匹配中文还真是个头疼的事,有了这个表达式就好办了   匹配双字节字符(包括汉字在内):[^x00-xff]   评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)   匹配空白行的正则表达式:ns*r   评注:可以用来删除空白行   匹配HTML标记的正... 阅读全文
posted @ 2010-08-09 10:28 A light heart lives long 阅读(437) 评论(0) 推荐(0) 编辑
摘要: 首先将网页内容整个抓取下来,数据放在byte[]中(网络上传输时形式是byte),进一步转化为String,以便于对其操作,实例如下:private static string GetPageData(string url){ if (url == null || url.Trim() == "") return null; WebClient wc = new WebClient(); wc.C... 阅读全文
posted @ 2010-08-09 10:24 A light heart lives long 阅读(3331) 评论(0) 推荐(0) 编辑