2018 年 2月 19 日随笔档案 - 酱紫安

2018年2月19日

一、爬虫的基本体系和urllib的基本使用

摘要：爬虫网络是一爬虫种自动获取网页内容的程序，是搜索引擎的重要组成部分。网络爬虫为搜索引擎从万维网下载网页。一般分为传统爬虫和聚焦爬虫。爬虫的分类传统爬虫从一个或若干初始网页的URL开始，获得初始网页上的URL，在抓取网页的过程中，不断从当前页面上抽取新的URL放入队列，直到满足系统的一定停止条件阅读全文

posted @ 2018-02-19 09:49 酱紫安阅读(537) 评论(2) 推荐(0)

酱紫安

一、爬虫的基本体系和urllib的基本使用

导航

公告