IK分词器

在线安装ik插件(较慢)

点击查看代码
# 进入容器内部
docker exec -it elasticsearch /bin/bash
# 在线下载并安装
./bin/elasticsearch-plugin  install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip
#退出
exit
#重启容器
docker restart elasticsearch

离线安装ik插件
安装插件需要知道elasticsearch的plugins目录位置,而我们用了数据卷挂载,因此需要查看elasticsearch的数据卷目录,通过下面命令查看:
docker volume inspect es-plugins
显示结果:

说明plugins目录被挂载到了:/var/lib/docker/volumes/es-plugins/_data这个目录中。
解压缩分词器安装包,上传到es容器的插件数据卷中。也就是/var/lib/docker/volumes/es-plugins/_data。
重启容器。

扩展词词典
随着互联网的发展,“造词运动”也越发的频繁。出现了很多新的词语,在原有的词汇列表中并不存在。比如:“原神”,“op” 等。
所以我们的词汇也需要不断的更新,IK分词器提供了扩展词汇的功能。

  1. 打开IK分词器config目录

  2. 在IKAnalyzer.cfg.xml配置文件内容添加:

  3. 新建一个 ext.dic,在该文件中添加新词。可以参考config目录下复制一个配置文件进行修改。

  4. 重启elasticsearch

停用词词典

  1. IKAnalyzer.cfg.xml配置文件内容添加:
  2. 在 stopword.dic 添加停用词
  3. 重启elasticsearch,kibana

IK分词器的几种模式:

  • ik_smart:智能切分,粗粒度
  • ik_max_word:最细切分,细粒度
posted @ 2023-06-02 15:51  wzh_Official  阅读(31)  评论(0编辑  收藏  举报