禁止所有搜索爬虫访问网站指定目录robots.txt
禁止所有搜索爬虫访问网站指定目录
文件放置不让爬取的网站文件夹目录里
robots.txt
User-agent: *
Disallow: /

User-Agent值可改为:
| 搜索引擎 | User-Agent值 |
|---|---|
| googlebot | |
| 百度 | baiduspider |
| 雅虎 | slurp |
| MSN | msnbot |
| Alexa | is_archiver |
禁止所有搜索爬虫访问网站指定目录
文件放置不让爬取的网站文件夹目录里
robots.txt
User-agent: *
Disallow: /

User-Agent值可改为:
| 搜索引擎 | User-Agent值 |
|---|---|
| googlebot | |
| 百度 | baiduspider |
| 雅虎 | slurp |
| MSN | msnbot |
| Alexa | is_archiver |