摘要: robots.txt文件可以有效的屏蔽搜索引擎抓取我们不需要被抓取的页面和网站源文件,其中的好处是限制搜索引擎过多的抓取不必要的内容,减少搜索引擎蜘蛛进行不必要的网站爬寻分散,也是为了让我们的网站不必要的内容不在搜索引擎被收录,不让别人搜索到。 其中什么样的文件会被限制抓取呢?一、是否通过robots.txt来屏蔽动态页面,减少页面的重复抓取?其实个人建议普通网站不必要进行动态页面的屏蔽,搜索引擎一般会自动判断是否重复,普通网站内容并不是非常多,一般出现重复页面的可能性也比较低,如果是信息站和论坛站等建议屏蔽动态页面。二、robots.txt屏蔽特殊页面,隐私内容的屏蔽。robots.txt屏 阅读全文
posted @ 2013-05-17 17:22 DODUI 阅读(333) 评论(0) 推荐(0)