探知,不断发现
探知不断发现

写一些数据抓取工具的时候.
我们一般是查看网页的源代码.然后把源代码拷到 regulator哪边去检测.开始写正则.
这个时候一个,难以查觉的错误发生了.

有时候你会发现.你写的正则在regulator里一切都是正常的.可是一到代码哪边就不正常了.于是开始郁闷.到底是什么一回事.

我自己一直在找这个原因.
开始了这样的一个尝试.自己在页面拉了一个richtextbox,把程序下载到的源代码,copy过去.这个时候正则可以取到数据了.
呵呵有点眉目了.

原来是在拷贝的时候 \r\n 变成了\n少了一个\r.
具体是谁引起的呢?
改天再看.
今天直接把download下来的数据replace("\r","")去掉.
一切正常.
Go home

posted on 2007-05-16 18:37  lovebanyi  阅读(394)  评论(0编辑  收藏  举报