摘要: 先简单的说robots.txt文件的规则:1、允许所有的搜索引起爬取任何内容User-agent:*Disallow:这个意思就是允许所有的搜索引擎爬取所有的页面,虽然Disallow是不允许的意思,但是后面是放空状态,这意思是没有不允许爬取的页面。2、屏蔽其中一种或者几种搜索引擎的爬取,以最近比较火的360综合搜索为例User-agent:360spiderDisallow:/User-agent:*Disallow:前两行的意思是不允许360综合搜索蜘蛛爬取任何页面,后面的解释见第一点。同理,如果除了屏蔽360综合搜索也想屏蔽百度蜘蛛,那就在开头继续添加。3、不允许搜索引擎抓取其中的某些页 阅读全文
posted @ 2012-11-28 14:38 samson1989 阅读(512) 评论(0) 推荐(0)
摘要: 由于我把我现在用的HotNews pro(热点新闻)这个主题的CMS页面模板做了一下修,把里面<?php include(‘header_.php’); ?>这句中的header_.php用header.php代替了,所以前台就没有了登陆入口了,所以我就输入http://www.baiweiled.com/wp-admin登陆,输入正确的用户名和密码后却无法登陆,我原以为可能是cookie的问题,所以就把浏览器的cookie清空了一下,可结果还是不行,这下可把我急坏了,要是登陆不了那可怎么办呀?于是上网查下Wordpress后台登陆的地址是什么,一个字“汗”,真臭大了,网上说得都是 阅读全文
posted @ 2012-11-28 13:49 samson1989 阅读(20417) 评论(0) 推荐(0)