63.文件系统进行数据建模以及文件搜索

主要知识点：

对类似文件系统这种的有多层级关系的数据进行建模
对上述模型数据进行搜索

一、文件系统数据构造

1、新建index,并自定义analyzer

新建一个index，自定义一个名为paths的analyzer,这个analyzer所用的分词器是path_hierarchy。语法：

PUT /fs

{

"settings": {

"analysis": {

"analyzer": {

"paths": {

"tokenizer": "path_hierarchy"

}

2、查看分词器：

GET /fs/_analyze

{

"text":"/a/b/c/d",

"analyzer": "paths"

}

path_hierarchy tokenizer会把/a/b/c/d这样一个路径分成： /a/b/c/d, /a/b/c, /a/b, /a 这四个路径

3、新建type的mapping

新建一个名为file的type，其中path所用的分词器是paths

PUT /fs/_mapping/file

{

"properties": {

"name": { "type": "keyword"},

"path": { "type": "keyword",

"fields": {"tree": { "type": "text","analyzer": "paths"}}

}

4、插入数据

PUT /fs/file/1

{

"name": "README.txt",

"path": "/workspace/projects/helloworld",

"contents": "这是我的第一个elasticsearch程序"

}

从这里也可以看出，新建的mapping和插入的数据可以不一一对应，本例中新建索引时没有建contents的mappings，但是在插入数据时插入了这个数据也不会报错。

二、对文件系统执行搜索

1、在特定目录下查找特定文件

文件搜索需求：查找一份，内容包括elasticsearch，在/workspace/projects/hellworld这个目录下的文件

GET /fs/file/_search

{

"query": {

"bool": {

"must": [{"match": {"contents": "elasticsearch"}},

{"constant_score": {"filter": {"term": {"path": "/workspace/projects/helloworld"}}}} ]

}

执行结果：

"hits": [

{

"_index": "fs",

"_type": "file",

"_id": "1",

"_score": 1.284885,

"_source": {

"name": "README.txt",

"path": "/workspace/projects/helloworld",

"contents": "这是我的第一个elasticsearch程序"

}

]

}

2、在指定目录下查找包含特定名称的所有的文件

搜索需求2：搜索/workspace目录下，内容包含elasticsearch的所有的文件

GET /fs/file/_search

{

"query": {

"bool": {

"must": [{"match": {"contents": "elasticsearch"}},

{"constant_score": {"filter": {"term": {"path.tree": "/workspace"}}}}]

}

为什么是path.tree

在本例中，上述两次搜索结果是一样的。

posted @ 2018-03-10 21:27 outback123 阅读(306) 评论(0) 收藏举报

刷新页面返回顶部

Outback

63.文件系统进行数据建模以及文件搜索

公告