会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
珍惜一切
机会总是留给有准备的人...
管理
随笔分类 -
网络爬虫
搜索引擎蜘蛛及网站robots.txt文件详解[转载]
摘要:我们知道,搜索引擎都有自己的“搜索机器人”(ROBOTS),并通过这些ROBOTS在网络上沿着网页上的链接(一般是http和src链接)不断抓取资料建立自己的数据库。对于网站管理者和内容提供者来说,有时候会有一些站点内容,不希望被ROBOTS抓取而公开。为了解决这个问题,ROBOTS开发界提供了两个...
阅读全文
posted @
2015-07-01 08:26
珍惜一切
阅读(2507)
评论(0)
推荐(0)