摘要:
utf8_unicode_ci和utf8_general_ci对中、英文来说没有实质的差别。utf8_general_ci 校对速度快,但准确度稍差。utf8_unicode_ci 准确度高,但校对速度稍慢。 如果你的应用有德语、法语或者俄语,请一定使用utf8_unicode_ci。一般用utf8 阅读全文
posted @ 2017-10-09 08:13
雪山上的蒲公英
阅读(24704)
评论(1)
推荐(8)
摘要:
1. 什么是中文分词器 对于英文,是安装空格、标点符号进行分词 对于中文,应该安装具体的词来分,中文分词就是将词,切分成一个个有意义的词。 比如:“我的中国人”,分词:我、的、中国、中国人、国人。 2. Lucene自带的中文分词器 StandardAnalyzer: 单字分词:就是按照中文一个字一 阅读全文
posted @ 2017-10-09 00:12
雪山上的蒲公英
阅读(863)
评论(0)
推荐(0)

浙公网安备 33010602011771号