python爬虫入门

  1. 什么是网络爬虫(一段程序或者一个脚本)
  2. 爬虫能干什么(自动的批量的采集我们需要的资源)
  3. 怎么采集(模拟浏览器自动的浏览网页)
  4. 开发爬虫的步骤
    • 目标数据(找到网站页面)
    • 分析数据加载流程(分析目标数据所对应的url)
    • 下载数据清洗,处理数据
    • 数据持久化

posted on 2018-03-14 21:01  半日闲人  阅读(81)  评论(0)    收藏  举报