摘要: utf8_unicode_ci和utf8_general_ci对中、英文来说没有实质的差别。utf8_general_ci 校对速度快,但准确度稍差。utf8_unicode_ci 准确度高,但校对速度稍慢。 如果你的应用有德语、法语或者俄语,请一定使用utf8_unicode_ci。一般用utf8 阅读全文
posted @ 2017-10-09 08:13 雪山上的蒲公英 阅读(24704) 评论(1) 推荐(8)
摘要: 1. 什么是中文分词器 对于英文,是安装空格、标点符号进行分词 对于中文,应该安装具体的词来分,中文分词就是将词,切分成一个个有意义的词。 比如:“我的中国人”,分词:我、的、中国、中国人、国人。 2. Lucene自带的中文分词器 StandardAnalyzer: 单字分词:就是按照中文一个字一 阅读全文
posted @ 2017-10-09 00:12 雪山上的蒲公英 阅读(863) 评论(0) 推荐(0)
/* 返回顶部代码 */