摘要:
用python如何实现一个站内搜索引擎? 先想想搜索引擎的工作流程: 1、网页搜集。用深度或者广度优先的方法搜索某个网站,保存下所有的网页,对于网页的维护采用定期搜集和增量搜集的方式。 2、建立索引库。首先,过滤掉重复的网页,虽然他们有不同的URL;然后,提取出网页的正文;最后,对正文切词,建立索引 阅读全文
posted @ 2016-01-24 09:51
yoyo_sincerely
阅读(687)
评论(0)
推荐(0)
浙公网安备 33010602011771号