下一站天后

今朝的容颜老于昨晚

  博客园 :: 首页 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
  88 随笔 :: 0 文章 :: 54 评论 :: 0 引用

抓取net分页,登录模式抓取,在126邮箱中,详细项目!

下面简单介绍用正则表达式截取抓取功能。

(.*?)表示要截取的中间的内容,遇到个别不规则的可以灵活舍弃。

Code

 

剔除html

Code

 

如何防止他人通过浏览器抓取自己网页呢?

 

Code
posted on 2009-06-05 17:19 孙雅玲 阅读(134) 评论(2) 编辑 收藏

评论

#1楼 2009-06-05 17:54 mangohappy      
防止抓取的方法一点也不起作用,agent是可以自行编程构建的
 回复 引用 查看   

#2楼 2010-01-07 09:36 冯岩      
@mangohappy
对的!agent同样可以通过程序来构建一个!完善的防止抓取应该是不存在的,所谓道高一尺魔高一仗。博主这里的方法可以简单的防止一些技术功底相对差一点的对手!
可以通过一个时间段内,同一IP请求的次数来进行限制!但这样必然会对系统的性能带来不好影响!
 回复 引用 查看