敏感词过滤算法

算法难道不能变得简单一些吗?便于理解逻辑?

参考文档如下:

http://cmsblogs.com/?p=1031

书中有个例子

{五={星={红={isEnd=0, 旗={isEnd=1}}, isEnd=0}, isEnd=0}, 中={isEnd=0, 国={isEnd=0, 人={isEnd=1}, 男={isEnd=0, 人={isEnd=1}}}}}

要想输出上面的格式和内容,敏感词库内容和格式如下:

中国男人
五星红旗
中国人

试着改造这个算法的某些判断条件来加深理解,为什么要这样写?是考虑哪种特殊的情况?

这个算法好搓,测试发现,如果敏感词库的内容是上面红色字体内容,我查询"男人"这两个词语,但是查询不出来。

posted @ 2014-09-30 16:41  唾手可得的树  阅读(297)  评论(0编辑  收藏  举报