摘要: 在面试中,如果你被问到:“Elasticsearch(ES)在数据量很大的情况下(数十亿级别)如何提高查询效率?” 那么面试官其实是在测试你是否有实际使用 ES 的经验。为什么这么说? 因为很多人以为 ES 性能非常强大,但实际上,在数据量达到几亿甚至数十亿条时,你可能会惊讶地发现,搜索一次需要 5 阅读全文
posted @ 2025-06-10 16:38 大数据从业者FelixZh 阅读(291) 评论(0) 推荐(0)
摘要: 在开发中遇到一个业务诉求,需要在千万量级的底池数据中筛选出不超过 10W 的数据,并根据配置的权重规则进行排序、打散(如同一个类目下的商品数据不能连续出现 3 次)。下面对该业务诉求的实现,设计思路和方案优化进行介绍。 对“千万量级数据中查询 10W 量级的数据”设计了如下方案: 多线程+CK 翻页 阅读全文
posted @ 2025-06-10 15:59 大数据从业者FelixZh 阅读(126) 评论(0) 推荐(0)
摘要: 1. 硬件优化1.1 内存分配Elasticsearch 对内存的需求较高,建议分配足够的堆内存。默认情况下,Elasticsearch 会使用系统内存的 50% 作为堆内存,但不要超过 32GB(因为 JVM 的指针压缩机制在 32GB 以下更高效)。 修改 JVM 堆内存:编辑 elastics 阅读全文
posted @ 2025-06-10 14:02 大数据从业者FelixZh 阅读(285) 评论(0) 推荐(0)
大数据从业者