会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
SnailsWalk
时光如流水,且行且珍惜
博客园
首页
新随笔
联系
管理
订阅
2017年6月17日
Python3爬虫笔记一
摘要: 1.提取出‘[ ]’里的数字,比如在爬取煎蛋网妹子图时需要去掉'[ ]'提取出里面的数字,也就是页码,这里用到的是python里的re模块的sub方法。 span_tag = sou.find_all('span', attrs={'class': 'current-comment-page'})[
阅读全文
posted @ 2017-06-17 17:44 SnailsH
阅读(8)
评论(0)
推荐(0)
公告