导航类查询词的收集方法
导航类的查询是指那些有明确寻址需求的查询,如“优酷网”或“优酷”等。目前很多互联网用户很可能只能记得百度等搜索引擎的网址,或把百度设置为首页,要进别的网站时,一般通过搜索来解决。
在搜索引擎中,对于导航类的查询,如果返回的第一条搜索结果不是目标网站的话,对用户的搜索体验是巨大的伤害。比如搜索“中国银行”,如果返回的不是中国银行的网站,而是某钓鱼网站的话,那很有可能对用户造成非常的伤害。因此,很有必要收集这些导航类的查询词和其对应的网址。
如何收集这类词呢?目前想到的方法是人工编辑的网站目录,如百度网址大全,雅虎网址大全。从这些人工编辑的网址目录中找出这类寻址类的query和对应的url,然后由人工的方法对query进行变换(一般是删除某些词,比如腾讯网和腾讯其实都应该算寻址类的query)。
但是其实最好是能做到寻址类query的自动挖掘,目前没有想到比较好的办法,大家有的好的方法,欢迎留言进行讨论,谢谢。
本文基于署名 2.5 中国大陆许可协议发布,欢迎转载,演绎或用于商业目的,但是必须保留本文的署名小橋流水(包含链接)。如您有任何疑问或者授权方面的协商,请给我发邮件。