摘要: 一、本课知识路线 1、Requests框架:自动爬取HTML页面与自动网络请求提交 2、robots.txt:网络爬虫排除标准 3、BeautifulSoup框架:解析HTML页面 4、Re框架:正则框架,提取页面关键信息 5、Scrapy框架:网络爬虫原理介绍,专业爬虫框架介绍 二、Request 阅读全文
posted @ 2017-04-06 14:41 起航追梦人 阅读(954) 评论(0) 推荐(0)