摘要: 倒排索引基本概念 文档(Document): 一般搜索引擎的处理对象是互联网网页,而文档这个概念要更宽泛些,代表以文本形式存在的存储对象,相比网页来说,涵盖更多种形式,比如Word,PDF,html,XML等不同格式的文件都可以称之为文档。再比如一封邮件,一条短信,一条微博也可以称之为文档。在本书后 阅读全文
posted @ 2022-04-17 22:21 听风者628 阅读(131) 评论(0) 推荐(0)