随笔分类 -  ES

摘要:路由 当你索引一个文档,它被存储在单独一个主分片上。Elasticsearch 是如何知道文档属于哪个分片的呢?当你创建一个新文档,它是如何知道是应该存储在分片 1 还是分片 2 上的呢? 进程不能是随机的,因为我们将来要检索文档。 算法决定: shard = hash(routing) % num 阅读全文
posted @ 2019-11-19 08:38 玩转大数据 阅读(1466) 评论(0) 推荐(0)
摘要:相关性算分 指文档与查询语句间的相关度,通过倒排索引可以获取与查询语句相匹配的文档列表 如何将最符合用户查询需求的文档放到前列呢? 本质问题是一个排序的问题,排序的依据是相关性算分,确定倒排索引哪个文档排在前面 影响相关度算分的参数: A. TF(Term Frequency):词频,即单词在文档中 阅读全文
posted @ 2019-11-18 21:22 玩转大数据 阅读(768) 评论(0) 推荐(0)
摘要:设置 IP 地址 vi /etc/sysconfig/network-scripts/ifcfg-ens32 重启网卡 [root@localhost ~] systemctl restart network 查看防火墙状态 firewall-cmd --state 关闭防火墙 [root@loca 阅读全文
posted @ 2019-11-05 14:49 玩转大数据 阅读(1481) 评论(0) 推荐(0)