• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
花儿爷
博客园    首页    新随笔    联系   管理     
2018年6月4日
urllib库
摘要: 爬虫基础 1.爬虫:请求网站并请求数据的自动化程序。 2.爬虫的基本流程: 1.发起请求 通过http库向目标站点发起请求,即发送一个request,请求包含额外的headers信息,等待服务器响应。 2.解析内容 得到内容是HTML,可以用正则表达式、网页解析库进行解析。可能是json,可能是二进 阅读全文
posted @ 2018-06-04 11:51 flowerszhao 阅读(159) 评论(0) 推荐(0)
Requests库
摘要: Requests库 Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库如果你看过上篇文章关于urllib库的使用,你会发现,其实urllib还是非常不方便的,而Requests它会比urllib更加方便,可以节约我们大量的工作。( 阅读全文
posted @ 2018-06-04 11:49 flowerszhao 阅读(342) 评论(0) 推荐(0)
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3