robots 攻防世界进阶

这道题怎么讲呢

就差那么一点

。。。。。。

 

正题,robots协议的知识知道,这个协议是规定了那些自己网页的内容能够访问,哪些不能够访问,由于题目是给了一个藏有flag的环境,所以它一定藏在不能够放轻易访问的地方,也就是disallow对应的端口,接下来就是想办法改一下它的robots协议,首先在url后面加上/robots.txt再运行一下,就得到了响应的页面,知道了,disallow的端口,flag就直接藏在了disallow的端口里面,。。。直接建立端口连接在运行一下就得到flag了,在url后面加上/端口,要去掉之前输入的协议。

1、User-agent: *

一般博客的robots.txt指令设置都是面对所有spider程序,用通配符“*”即可。如果有独立User-agent的指令规则,尽量放在通配“*”User agent规则的上方。

2、Disallow: /wp-admin/

Disallow: /wp-content/

Disallow: /wp-includes/

屏蔽spider捉取程序文件,同时也节约了搜索引擎蜘蛛资源。

3、Disallow: /*/trackback

每个默认的文章页面代码里,都有一段trackback的链接,如果不屏蔽让蜘蛛去捉取,网站会出现重复页面内容问题。

4、Disallow: /feed

Disallow: /*/feed

Disallow: /comments/feed

 

这些是一些格式,可以参考一下,

7、Disallow: /*.jpg$      !!!!!!!!!!!!!!

Disallow: /*.jpeg$     !!!!!!!!!!!!!!!!个人觉得这个可以背一下。

Disallow: /*.gif$

Disallow: /*.png$

Disallow: /*.bmp$

屏蔽捉取任何图片文件,在这里主要是想节约点宽带,不同的网站管理员可以按照喜好和需要设置这几条指令。

 

至于改协议的事情,,,,对不起,请当我没说过。。。。

posted @ 2020-11-30 13:41  ctfliar  阅读(254)  评论(0)    收藏  举报