会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
爬行的乌龟
博客园
首页
新随笔
联系
订阅
管理
2018年5月3日
python爬虫的基本框架
摘要: 1.爬虫的基本流程: 通过requests库的get方法获得网站的url 浏览器打开网页源码分析元素节点 通过BeautifulSoup或者正则表达式提取想要的数据 储存数据到本地磁盘或者数据库 2.正式开工啦 url = “http://www.jianshu.com” page = reques
阅读全文
posted @ 2018-05-03 16:39 遗世独立的愚公
阅读(352)
评论(0)
推荐(0)
公告