随笔分类 -  正则表达式

(转)正则表达式小括号的多义性
摘要:原文地址:http://www.cnblogs.com/snandy/p/3650309.html小括号在正则表达式这有以下意义限定量词作用的范围限定多选结构的范围为反向引用捕获文本分组捕获只分组不捕获前瞻一、限定量词作用的范围?123var reg1 = /(Matz)?/; // 0或1个Mat... 阅读全文

posted @ 2014-04-18 00:54 黑子范

(转)使用零宽断言来匹配不包含连续字符串的行
摘要:原文地址:http://blog.khotyn.com/blog/2013/07/24/zero-width-assert/最近在工作中遇到一个问题,有 N 个字符串,需要用正则表达式去过滤掉不包含某一个特定连续字符串(比如abc)的字符串。在网上搜罗了一大把,找到了在 Perl 5 的正则表达式中有零宽断言这个东西,非常强大,先来了解下零宽断言倒是是什么?简单的说,零宽断言是查找在某些内容之前或者之后的东西,这样解释起来可能比较抽象,我们来具体看下几种零宽断言:(?=exp):这个零宽断言用来断言自身出现的位置之后能够匹配到表达式 exp,考虑下面这一个正则表达式 q(?=u),这个正则表达 阅读全文

posted @ 2013-12-17 23:23 黑子范

(转)教你怎么理解正则表达式之零宽断言(环视)
摘要:原文地址:http://blog.csdn.net/binjly/article/details/12152235思考题今天有人问一个关于零宽断言的正则:[javascript]view plaincopyvarreg=/(?=a)b/;reg.exec("ab");大家思考下这个正则为什么匹配不了?我们先了解一下什么叫零宽断言,最后再来回答这个问题。概念理解零宽断言(有的资料叫它环视),分为零宽度正预测先行断言( 格式为 (?=exp) ),和零宽度正回顾后发断言( 格式为 (?<=exp) )。javascript目前只支持前者,所以这里我们只以前者来讨论。(为了 阅读全文

posted @ 2013-12-17 23:22 黑子范

(转)通过Javascript得到URL中的参数(query string)
摘要:原文地址:http://www.cnblogs.com/season-huang/p/3322561.html我们知道,"GET"请求中,通常把参数放在URL后面,比如这样http://www.cnblogs.com/season-huang/index?param=yes&article=1其中,红色部分便是URL中的参数。那么,如何通过Javascript得到它呢?而且怎么从这么一堆字符串中找到我所需要的参数所对应的值呢?方法一:function getParameterByName(name) { name = name.replace(/[\[]/, &qu 阅读全文

posted @ 2013-09-25 15:38 黑子范 阅读(484) 评论(0) 推荐(0)

(转)正则表达式—RegEx(RegularExpressio)(三)
摘要:原文地址:http://www.cnblogs.com/feng-c-x/archive/2013/09/05/3302465.html今日随笔,继续写一点关于正则表达式的 知识。前两天介绍了正则表达式验证匹配,提取等一些基本的知识,今天继续分享下它的另一个强大的应用:替换(replace)。开始之前,还是要补一下昨天的内容。在我们昨天的内容里,有一个提取组的概念,在上一节中,我么只用了数值索引来获取某组的value。我们还可以给某个组取一个别名,然后通过别名来找到相应的组的value。我们还拿昨天的name和age那个例子说明: 1 //--------------------------. 阅读全文

posted @ 2013-09-05 18:00 黑子范 阅读(242) 评论(0) 推荐(0)

(转)精通正则表达式(元字符)
摘要:原文地址:http://www.cnblogs.com/zhuimengdeyuanyuan/archive/2013/02/05/2892988.html 13年1月初在公司开了一次正则表达式的讲座,在这里希望把那一个月努力专研的一些东西分享一下,先分享一本大家熟悉的书《精通正则表达式》,的确是好书,不过要不是工作原因,我才不会一个月内看了两遍呢!实在是枯燥的很啊!不过最近发现的确对自己很有帮助,还可以时常在工作中要到,有时候也能帮群里解决一些问题。我这里算是把那本书精简了一下的版本吧!没书上的详细,不过结合了网上一些资料加上自己的试验。 1、历史起源 正则表达式的“鼻祖”或许可一直... 阅读全文

posted @ 2013-02-08 16:21 黑子范 阅读(214) 评论(0) 推荐(0)

(转)正则表达之零宽断言(零宽度正预测先行断言)
摘要:原文地址:http://www.cnblogs.com/mu-mu/archive/2013/02/06/2893581.html最近为了对html文件进行源码处理,需要进行正则查找并替换。于是借着这个机会把正则系统地学一下,虽然以前也用过正则,但每次都是临时学一下混过关的。在学习的过程中还是遇到不少问题的,特别是零宽断言(这里还要吐槽下,网上到处都是都复制粘贴的内容,遇到个问题查看了不少重复的东西,汗!!!),所以在这里把自己的理解写下来,方便以后查阅!零宽度正预测先行断言是什么呢,看msdn上的官方解释定义(?= 子表达式)(零宽度正预测先行断言。)仅当子表达式在此位置的右侧匹配时才继续匹 阅读全文

posted @ 2013-02-08 16:14 黑子范 阅读(206) 评论(0) 推荐(0)

(转)正则表达式语法备忘录
摘要:原文地址:http://www.cnblogs.com/fangrobert/archive/2011/08/25/2153209.html字符描述\将下一个字符标记为一个特殊字符、或一个原义字符、或一个 后向引用、或一个八进制转义符。例如,'n' 匹配字符 "n"。'\n' 匹配一个换行符。序列 '\\' 匹配 "\" 而 "\(" 则匹配 "("。^匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n&# 阅读全文

posted @ 2012-08-13 16:03 黑子范 阅读(140) 评论(0) 推荐(0)

(转)跟我一起制作数据采集-获取淘宝网店宝贝数据信息(二)
摘要:原文地址:http://www.cnblogs.com/leizhang/archive/2012/04/17/2453783.html第一篇的内容请看这里: http://www.cnblogs.com/leizhang/archive/2012/04/13/2446220.html代码下载在文章最后如何取消正在进行的异步操作 我们从前文可以知道我们进行的异步操作主要如下: 下载一个网页 通过正则表达式分析网页 我们可以发现步骤1是唯一耗时的操作,而且如果在我们点击取消按钮的时候我们如果已经下载了某一个网页我们也没必要中止第二步操作。 因此我们希望点击按钮的时候能够中止所有正在下载网页的异. 阅读全文

posted @ 2012-04-18 17:43 黑子范 阅读(418) 评论(0) 推荐(0)

(转)跟我一起制作数据采集-获取淘宝网店宝贝数据信息(一)
摘要:原文地址:http://www.cnblogs.com/leizhang/archive/2012/04/13/2446220.html创建项目并绘制界面打开Visual Studio并创建一个基于.net 4.5的WPF项目:GetTaoBaoItems之所以采用4.5是因为后面我们将要用到里面免费的新的异步编程特性.绘制如下主界面: 下载网页我们知道要进行网络数据采集必不可少就要下载网页内容,因此我们首先需要构建一个下载网页内容的函数:注意using System.Net 我们下载哪个网页了?我们可以通过类似网址查看一个店铺的所有宝贝: [淘宝店铺地址]/search.htm,如下图所示. 阅读全文

posted @ 2012-04-14 17:28 黑子范 阅读(603) 评论(0) 推荐(0)

(转)正则表达式语法
摘要:原文地址:http://www.yesky.com/imagesnew/software/vbscript/html/jsgrpRegExpSyntax.htm一个正则表达式就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。这里有一些可能会遇到的正则表达式示例:Visual Basic Scripting EditionVBScript匹配/^\[ \t]*$/"^\[ \t]*$"匹配一个空白行。/\d{2}-\d{5}/&qu 阅读全文

posted @ 2012-04-14 17:27 黑子范 阅读(152) 评论(0) 推荐(0)

(转)30分钟正则表达式入门
摘要:原文地址:http://www.cnblogs.com/xiaohuzi1990/archive/2011/08/29/2157510.h入门\b代表着单词的开头或结尾,也就是单词的分界处。虽然通常英文的单词是由空格或标点符号或换行来分隔的,但是\b并不匹配这些单词分隔符中的任何一个,它只匹配一个位置。如果同时使用其它的一些元字符,我们就能构造出功能更强大的正则表达式。比如下面这个例子:0\d\d-\d\d\d\d\d\d\d\d匹配这样的字符串:以0开头,然后是两个数字,然后是一个连字号“-”,最后是8个数字(也就是中国的电话号码。当然,这个例子只能匹配区号为3位的情形)。这里的\d是一个. 阅读全文

posted @ 2012-04-14 17:26 黑子范 阅读(208) 评论(0) 推荐(0)

导航