摘要: 1. 预处理过程 预处理主要用来事先生成程序在运行过程中可能用到的数据,以便加速处理时间。 预处理的过程主要生成程序所需的三个文件:网页库文件,网页位置信息文件和倒排索引文件。 网页库文件 其中网页库文件ripepage.lib主要是以格式化的数据存储大量的网页信息,每个网页的格式化数据为: id url title content 网页位置信... 阅读全文
posted @ 2015-08-19 22:17 Acjx 阅读(899) 评论(0) 推荐(0) 编辑