python爬虫入门 - 半日闲人 - 博客园

python爬虫入门

什么是网络爬虫（一段程序或者一个脚本）
爬虫能干什么（自动的批量的采集我们需要的资源）
怎么采集（模拟浏览器自动的浏览网页）
开发爬虫的步骤

目标数据（找到网站页面）
分析数据加载流程（分析目标数据所对应的url）
下载数据清洗，处理数据
数据持久化

posted on 2018-03-14 21:01 半日闲人阅读(88) 评论(0) 收藏举报

刷新页面返回顶部

导航

公告