会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
vlj
博客园
首页
新随笔
联系
订阅
管理
2018年9月3日
Python爬虫的步骤和工具
摘要: #四个步骤 1.查看crawl内容的源码格式 crawl的内容可以是 url(链接),文字,图片,视频 2.请求网页源码 (可能要设置)代理,限速,cookie 3.匹配 用正则表达式匹配 4.保存数据 文件操作 #两个基本工具(库) 1.urllib 2.requests #使用reuests库的
阅读全文
posted @ 2018-09-03 19:37 vlj
阅读(648)
评论(0)
推荐(0)
公告