Python爬虫【第一篇】:Python爬虫入门综述

前提

Python版本2.7

爬虫概念

  网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。

根据我的经验,要学习Python爬虫,我们要学习的共有以下几点:

  • Python基础知识
  • Python中urllib和urllib2库的用法
  • Python正则表达式
  • Python爬虫框架Scrapy
  • Python爬虫更高级的功能

Python基础学习

1、慕课网

2、廖雪峰Python教程

3、简明Python教程

 

Python urlib和urllib2库学习

Python正则表达式

爬虫框架Scrapy

 

posted @ 2016-09-29 21:00  每天进步一点点!!!  阅读(193)  评论(0)    收藏  举报