WordPress中文分词与智能搜索
问题
WordPress的搜索功能非常简陋,如果用户搜索“日语综合教程+第六册”,WordPress会机械地构造一个wp_posts.post_title LIKE '%日语综合教程+第六册%'的SQL查询送到数据库里,结果十有八九找不到任何文章。因为我的文章里并没有直接出现这种句子,我一般给“日语综合教程”加了书名号,并且“第六册”前面一般有空格。
解决思路
解决思路是对用户的查询字串进行分词,然后用空格隔开,最后送到数据库里查询。
中文分词
以前我一直抱怨PHP平台并没有一款出色的分词套件,不过现在SAE提供了一款:http://apidoc.sinaapp.com/sae/SaeSegment.html

浙公网安备 33010602011771号