随笔分类 - 搜索
摘要:一.基本使用 双引号 代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。bd和Google 都支持这个指令。 例如: “javar高性能程序开发” 减号 代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的
阅读全文
摘要:原文地址 三叉搜索树是用来解决字典树的内存问题的数据结构。为了避免不需要的节点的内存占用,每个字典树节点不再使用数组,而是使用“树中有树”的结构。在三叉搜索树中,字典树节点的每个非空指针得到它自己。 例如,有四个单词,AB、ABBA、ABCD和BCD,它的三叉搜索树结构如下: 三叉搜索树包括三种箭头
阅读全文
摘要:一 基本构造 Trie树是搜索树的一种,来自英文单词"Retrieval"的简写,可以建立有效的数据检索组织结构,是中文匹配分词算法中词典的一种常见实现。它本质上是一个确定的有限状态自动机(DFA),每个节点代表自动机的一个状态。在词典中这此状态包括“词前缀”,“已成词”等。 双数组Trie(dou
阅读全文

浙公网安备 33010602011771号