随笔分类 -  搜索

摘要:一.基本使用 双引号 代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。bd和Google 都支持这个指令。 例如: “javar高性能程序开发” 减号 代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的 阅读全文
posted @ 2017-01-16 17:05 0x7C00 阅读(303) 评论(0) 推荐(0)
摘要:原文地址 三叉搜索树是用来解决字典树的内存问题的数据结构。为了避免不需要的节点的内存占用,每个字典树节点不再使用数组,而是使用“树中有树”的结构。在三叉搜索树中,字典树节点的每个非空指针得到它自己。 例如,有四个单词,AB、ABBA、ABCD和BCD,它的三叉搜索树结构如下: 三叉搜索树包括三种箭头 阅读全文
posted @ 2017-01-16 17:01 0x7C00 阅读(886) 评论(0) 推荐(0)
摘要:一 基本构造 Trie树是搜索树的一种,来自英文单词"Retrieval"的简写,可以建立有效的数据检索组织结构,是中文匹配分词算法中词典的一种常见实现。它本质上是一个确定的有限状态自动机(DFA),每个节点代表自动机的一个状态。在词典中这此状态包括“词前缀”,“已成词”等。 双数组Trie(dou 阅读全文
posted @ 2016-04-29 10:42 0x7C00 阅读(2261) 评论(0) 推荐(0)