摘要:
1、Elasticsearch 的选主是 ZenDiscovery 模块负责的,主要包含 Ping(节点之 间通过这个 RPC 来发现彼此)和 Unicast(单播模块包含一个主机列表以控制哪 些节点需要 ping 通)这两部分; 2、对所有可以成为 master 的节点(node.master: 阅读全文
posted @ 2020-06-19 21:21
咔啡
阅读(275)
评论(0)
推荐(0)
摘要:
特殊说明:Memcached 集群和 web 服务集群是不一样的,所有 Memcached 的数据总和才是数据库的数据。每台 Memcached 都是部分数据。(一台 memcached 的数据,就是一部分 mysql 数据库的数据) a、程序端实现 程序加载所有 mc 的 ip 列表,通过对 ke 阅读全文
posted @ 2020-06-19 21:10
咔啡
阅读(155)
评论(0)
推荐(0)
摘要:
Marvel 让你可以很简单的通过 Kibana 监控 Elasticsearch。你可以实时查看你 的集群健康状态和性能,也可以分析过去的集群、索引和节点指标。 阅读全文
posted @ 2020-06-19 21:09
咔啡
阅读(374)
评论(0)
推荐(0)
摘要:
1、当集群 master 候选数量不小于 3 个时,可以通过设置最少投票通过数量(discovery.zen.minimum_master_nodes)超过所有候选节点一半以上来解决脑裂问题; 2、当候选数量为两个时,只能修改为唯一的一个 master 候选,其他作为 data节点,避免脑裂问题。 阅读全文
posted @ 2020-06-19 20:57
咔啡
阅读(679)
评论(0)
推荐(0)
摘要:
1、SEE:https://elasticsearch.cn/article/32 2、倒排词典的索引需要常驻内存,无法 GC,需要监控 data node 上 segmentmemory 增长趋势。 3、各类缓存,field cache, filter cache, indexing cache, 阅读全文
posted @ 2020-06-19 20:43
咔啡
阅读(355)
评论(0)
推荐(0)
摘要:
SEE 基于 word2vec 和 Elasticsearch 实现个性化搜索 阅读全文
posted @ 2020-06-19 20:42
咔啡
阅读(234)
评论(0)
推荐(0)
摘要:
1、64 GB 内存的机器是非常理想的, 但是 32 GB 和 16 GB 机器也是很常见的。少于 8 GB 会适得其反。 2、如果你要在更快的 CPUs 和更多的核心之间选择,选择更多的核心更好。多个内核提供的额外并发远胜过稍微快一点点的时钟频率。 3、如果你负担得起 SSD,它将远远超出任何旋转 阅读全文
posted @ 2020-06-19 20:36
咔啡
阅读(404)
评论(0)
推荐(0)
摘要:
1、拼写纠错是基于编辑距离来实现;编辑距离是一种标准的方法,它用来表示经过插入、删除和替换操作从一个字符串转换到另外一个字符串的最小操作步数; 2、编辑距离的计算过程:比如要计算 batyu 和 beauty 的编辑距离,先创建一个7×8 的表(batyu 长度为 5,coffee 长度为 6,各加 阅读全文
posted @ 2020-06-19 20:35
咔啡
阅读(514)
评论(0)
推荐(0)
摘要:
想了解 ES 搜索的底层原理,不再只关注业务层面了。 解答: 搜索拆解为“query then fetch” 两个阶段。 query 阶段的目的:定位到位置,但不取。 步骤拆解如下: 1、假设一个索引数据有 5 主+1 副本 共 10 分片,一次请求会命中(主或者副本分片中)的一个。 2、每个分片在 阅读全文
posted @ 2020-06-19 20:33
咔啡
阅读(281)
评论(0)
推荐(0)
摘要:
1、搜索被执行成一个两阶段过程,我们称之为 Query Then Fetch; 2、在初始查询阶段时,查询会广播到索引中每一个分片拷贝(主分片或者副本分 片)。 每个分片在本地执行搜索并构建一个匹配文档的大小为 from + size 的 优先队列。 PS:在搜索的时候是会查询 Filesystem 阅读全文
posted @ 2020-06-19 20:32
咔啡
阅读(1531)
评论(0)
推荐(0)
摘要:
MULTI、EXEC、DISCARD、WATCH 阅读全文
posted @ 2020-06-19 20:31
咔啡
阅读(400)
评论(0)
推荐(0)
摘要:
常用字典数据结构如下所示: Trie 的核心思想是空间换时间,利用字符串的公共前缀来降低查询时间的开销以 达到提高效率的目的。它有 3 个基本性质: 1、根节点不包含字符,除根节点外每一个节点都只包含一个字符。 2、从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。 3、每个节点的 阅读全文
posted @ 2020-06-19 20:30
咔啡
阅读(186)
评论(0)
推荐(0)

浙公网安备 33010602011771号