IK分词器
在线安装ik插件(较慢)
点击查看代码
# 进入容器内部
docker exec -it elasticsearch /bin/bash
# 在线下载并安装
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip
#退出
exit
#重启容器
docker restart elasticsearch
离线安装ik插件
安装插件需要知道elasticsearch的plugins目录位置,而我们用了数据卷挂载,因此需要查看elasticsearch的数据卷目录,通过下面命令查看:
docker volume inspect es-plugins
显示结果:
说明plugins目录被挂载到了:/var/lib/docker/volumes/es-plugins/_data这个目录中。
解压缩分词器安装包,上传到es容器的插件数据卷中。也就是/var/lib/docker/volumes/es-plugins/_data。
重启容器。
扩展词词典
随着互联网的发展,“造词运动”也越发的频繁。出现了很多新的词语,在原有的词汇列表中并不存在。比如:“原神”,“op” 等。
所以我们的词汇也需要不断的更新,IK分词器提供了扩展词汇的功能。
-
打开IK分词器config目录
-
在IKAnalyzer.cfg.xml配置文件内容添加:
-
新建一个 ext.dic,在该文件中添加新词。可以参考config目录下复制一个配置文件进行修改。
-
重启elasticsearch
停用词词典
- IKAnalyzer.cfg.xml配置文件内容添加:
- 在 stopword.dic 添加停用词
- 重启elasticsearch,kibana
IK分词器的几种模式:
- ik_smart:智能切分,粗粒度
- ik_max_word:最细切分,细粒度