Elasticsearch之中文分词器
Elasticsearch之中文分词器
中文分词介绍
elasticsearch提供了几个内置的分词器:standard analyzer(标准分词器)、simple analyzer(简单分词器)、whitespace analyzer(空格分词器)、language analyzer(语言分词器)
而如果我们不指定分词器类型的话,elasticsearch默认是使用标准分词器的
我们需要下载中文分词插件,来实现中文分词
ik有两种分词方式:
-ik_smart:分的词少
-ik_max_word:分的词会多
下载
地址为:https://github.com/medcl/elasticsearch-analysis-ik
# 要与Elasticsearch版本相对应
# 命令行安装
bin/elasticsearch-plugin install [plugin_name]
# bin/elasticsearch-plugin install analysis-smartcn 安装中文分词器
# url安装
bin/elasticsearch-plugin install [url]
# bin/elasticsearch-plugin install https://artifacts.elastic.co/downloads/elasticsearch-plugins/analysis-smartcn/analysis-smartcn-6.4.0.zip
# 离线安装
# https://artifacts.elastic.co/downloads/elasticsearch-plugins/analysis-smartcn/analysis-smartcn-6.4.0.zip
1. 点击下载analysis-smartcn离线包
2. 将离线包解压到ElasticSearch 安装目录下的 plugins 目录下
3. 重启es。新装插件必须要重启es

浙公网安备 33010602011771号