随笔分类 - Project
摘要:1. 预处理过程 预处理主要用来事先生成程序在运行过程中可能用到的数据,以便加速处理时间。 预处理的过程主要生成程序所需的三个文件:网页库文件,网页位置信息文件和倒排索引文件。 网页库文件 其中网页库文件ripepage.lib主要是以格式化的数据存储大量的网页信息,每个网页的格式化数据为: id url title content 网页位置信...
阅读全文
摘要:该Project原来的应用场景是对电商网站中输入一个错误的商品名称进行智能纠错,比如iphoae纠错为iphone。以下介绍的这个版本对其作了简化,项目源代码地址参见我的github:https://github.com/jianxinzhou/MyProject_1/tree/uint32 。 该Project的主要思想是利用字符串编辑距离来实现拼写纠错。每当客户端来一个查询词,服务器返回与其...
阅读全文

浙公网安备 33010602011771号