会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
昨、夜星辰
博客园
首页
新随笔
联系
订阅
管理
2016年5月17日
爬虫实例——爬取煎蛋网OOXX频道(反反爬虫——伪装成浏览器)
摘要: 煎蛋网在反爬虫方面做了不少工作,无法通过正常的方式爬取,比如用下面这段代码爬取无法得到我们想要的源代码。 执行上述代码,你得到的结果应该跟我一样: 煎蛋网应该是通过检测headers来判断是否爬虫,要想获取正常的源代码,需要伪装成浏览器。 当然,这个爬虫脚本也不是永久有效,说不定哪天煎蛋就出新招了,
阅读全文
posted @ 2016-05-17 12:05 昨、夜星辰
阅读(3957)
评论(0)
推荐(0)