苦甜乐酸辣咸
变成人生百味
构造半自动化搜索引擎查询,需要了解一下,百度url构成方式和参数的作用。虽然是转载,但是还是有很大的学习意义了。

http://www.baidu.com/baidu?cl=3&tn=baidutop10&wd=%B6%B9%B0%EA

这是一个从百度风云榜里面截取的url链接了。cl=3 表示网页搜索,tn表示来源站点,wd是关键词%B6%B9%B0%EA 是utf编码之后的结果了。


百度搜索命令中的参数

必备参数:

wd——查询的关键词(Keyword)

pn——显示结果的页数(Page Number)

cl——搜索类型(Class),cl=3为网页搜索

可选参数:

rn——搜索结果显示条数(Record Number),取值范围在10--100条之间,缺省设置rn=10

ie——查询输入文字的编码(Input Encoding),缺省设置ie=gb2312,即为简体中文

tn——提交搜索请求的来源站点

几个有用的tn

tn=baidulocal 表示百度站内搜索,返回的结果很干净,无广告干扰。

比如,在百度站内搜索“快乐”,看看返回结果是不是很清爽。

tn=baiducnnic 想把百度放在框架中吗?试试这个参数就可以了,是百度为Cnnic定制的

si——在限定的域名中搜索,比如想在新浪的站内搜索可使用参数si=sina.com.cn,要使这个参数有效必须结合ct参数一起使用。

ct——此参数的值一般是一串数字,估计应该是搜索请求的验证码

si和ct参数结合使用,比如在sina.com.cn中搜索“理想”,可用:http://www.baidu.com/s?q=&ct=2097152&si=sina.com.cn&ie=gb2312&cl=3&wd=理想

bs——上一次搜索的关键词(Before Search),估计与相关搜索有关

posted on 2008-02-12 16:40  苦甜乐  阅读(1820)  评论(0编辑  收藏  举报