摘要:
【布尔查询的处理】 1、建立好倒排索引后如何处理查询呢?看下例: 2、对于And、Or、Not的操作,很容易想到都可以在O(N1+N2)内解决,即线性(N1、N2为文档频率,即倒排索引表长度)。 3、查询优化(Query Optimization),除了AndOrNot的算法设计外,组织与同等转换查询过程对查询的效率也有很大的帮助。一个启发式的想法是: 按照词项的文档频率(也就是倒排记录表的长度)从小到大依次进行处理,如果我们先合并两 个最短的倒排记录表,那么所有中间结果的大小都不会超过最短的倒排记录表 2,这样处理所 需要的工作量很可能最少。 阅读全文
posted @ 2013-09-07 23:10
Tekkaman
阅读(1177)
评论(0)
推荐(0)
摘要:
【Information Retrieval】 1、信息检索/获取(Information Retrieval,简称IR)是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。 2、布尔检索模型 3、文档(document)是信息检索系... 阅读全文
posted @ 2013-09-07 15:51
Tekkaman
阅读(897)
评论(0)
推荐(0)
摘要:
【回文O(N)算法】 利用回文的对称性质,可以设计出O(N)的算法。 参考:http://blog.csdn.net/ggggiqnypgjg/article/details/6645824 阅读全文
posted @ 2013-09-07 14:34
Tekkaman
阅读(298)
评论(0)
推荐(0)
摘要:
【template】 1、当定义template的时候,并没有生成实例,当使用一个模板的时候才会生成一个实例。 2、模板的编译: 1)在实例化之前,先检查模板代码本身,查看是否有语法错误,如遗漏分号。 2)在实例化期间,检查模板代码,看是否所有的调用都有效,如类型匹配。 3、自定义类型会优先于参... 阅读全文
posted @ 2013-09-07 11:01
Tekkaman
阅读(466)
评论(0)
推荐(0)
浙公网安备 33010602011771号