11 2011 档案
摘要: Trie树,又称字符查找树、前缀树,主要用于字符匹配(详见http://en.wikipedia.org/wiki/Trie)。适合做关键词查找,比如查找文章中的关键字然后给他们加链接。 当然对脏词的过滤应用也是样,只是把替换连接的工作换成了替换字符。当前的代码还只是进行简单的替换,并没有做一些字符的处理,比如“昨天见到你妈,逼我要买房”,这本身不是脏词,因为有逗号,所以程序里要增加字符的范围判断。程序中的skip就是用来过滤脏词的简单变体,比如“找*小*姐”,默认是最多跳过3个字符,这个可以随便调整了。总之是一个Trie的锻炼吧。 public class TrieTree { ...阅读全文
摘要: 回顾之前的章节,我们大致讲了下缓存的基本概念、原理、策略和常用方法。可能会有朋友会说,访问量小根本不需要缓存,徒增开发的复杂度,访问量大的话本地缓存也没意义。其实这话说的也不无道理,当然我们不能把这句话看成绝对的话,不然什么话都成废话了:),其实我们研究学习的任何技术都不会白学的,每种技术都有他的使用范畴,只是当我们面对新的层次时,需要改变,需要重新学习。我们之前讲的每篇都非常有用,本地缓存也非常有用。不过当我们面临大的数据量和访问量的考研时,就需要使用新的解决方案。今天就讲讲共享缓存那些事。到底什么是共享缓存?为什么要用共享缓存?新的层次就是指当我们仅仅依赖数据库和本地缓存已经无法满足我们的阅读全文