会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Baby-DRagon
博客园
首页
新随笔
联系
订阅
管理
2022年4月3日
python爬取网站信息
摘要: 一.爬取网站数据 大体思路,采用requests模块爬取页面源代码,处理网页反爬机制(加入headers模拟人工访问浏览器),再采用re模块进行信信息处理分割,取得我所需要的信息。整合为列表方便下一步处理。 1 import re 2 import requests 3 # 请求页面 4 url =
阅读全文
posted @ 2022-04-03 21:34 Baby-DRagon
阅读(1166)
评论(0)
推荐(1)
公告