Elasticsearch之中文分词器

Elasticsearch之中文分词器

中文分词介绍

elasticsearch提供了几个内置的分词器:standard analyzer(标准分词器)、simple analyzer(简单分词器)、whitespace analyzer(空格分词器)、language analyzer(语言分词器)

而如果我们不指定分词器类型的话,elasticsearch默认是使用标准分词器的

我们需要下载中文分词插件,来实现中文分词


ik有两种分词方式:
	-ik_smart:分的词少
  -ik_max_word:分的词会多

下载

地址为:https://github.com/medcl/elasticsearch-analysis-ik

# 要与Elasticsearch版本相对应

# 命令行安装
bin/elasticsearch-plugin install [plugin_name]
# bin/elasticsearch-plugin install analysis-smartcn  安装中文分词器

# url安装
bin/elasticsearch-plugin install [url]
# bin/elasticsearch-plugin install https://artifacts.elastic.co/downloads/elasticsearch-plugins/analysis-smartcn/analysis-smartcn-6.4.0.zip

# 离线安装

# https://artifacts.elastic.co/downloads/elasticsearch-plugins/analysis-smartcn/analysis-smartcn-6.4.0.zip
1. 点击下载analysis-smartcn离线包
2. 将离线包解压到ElasticSearch 安装目录下的 plugins 目录下
3. 重启es。新装插件必须要重启es
posted @ 2022-03-15 17:11  yang_night  阅读(624)  评论(0)    收藏  举报