会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
ubunhan
博客园
首页
新随笔
联系
订阅
管理
04 2019 档案
爬虫思路总结
摘要:1.URL star_url 当URL规律特别明显的时候,构建URL地址 直接在页面中提取下一页的URL 2.发送请求获取相应 添加随机的User-Agent 添加随机的代理IP 在对方判断出我们是爬虫后,应该添加更多的headers字段,包括cookie cookie的处理可以用session 如
阅读全文
posted @
2019-04-12 09:04
ubunhan
阅读(151)
评论(0)
推荐(0)