会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
箭端玫城帅
Be yourself , Everyone else is already taken.
博客园
首页
新随笔
联系
订阅
管理
2014年8月23日
网络爬虫基本原理
摘要: 网络爬虫是捜索引擎抓取系统的重要组成部分。爬虫的主要目的是将互联网上的网页下载到本地形成一个或联网内容的镜像备份。这篇博客主要对爬虫以及抓取系统进行一个简单的概述。一、网络爬虫的基本结构及工作流程 一个通用的网络爬虫的框架如图所示: 网络爬虫的基本工作流程如下: 1.首先选取一部分精心挑选的种子UR...
阅读全文
posted @ 2014-08-23 11:05 chenqiushi909
阅读(239)
评论(0)
推荐(0)
公告