摘要:        
在面试中,如果你被问到:“Elasticsearch(ES)在数据量很大的情况下(数十亿级别)如何提高查询效率?” 那么面试官其实是在测试你是否有实际使用 ES 的经验。为什么这么说? 因为很多人以为 ES 性能非常强大,但实际上,在数据量达到几亿甚至数十亿条时,你可能会惊讶地发现,搜索一次需要 5    阅读全文
posted @ 2025-06-10 16:38
大数据从业者FelixZh
阅读(291)
评论(0)
推荐(0)
        
            
        
        
摘要:        
在开发中遇到一个业务诉求,需要在千万量级的底池数据中筛选出不超过 10W 的数据,并根据配置的权重规则进行排序、打散(如同一个类目下的商品数据不能连续出现 3 次)。下面对该业务诉求的实现,设计思路和方案优化进行介绍。 对“千万量级数据中查询 10W 量级的数据”设计了如下方案: 多线程+CK 翻页    阅读全文
posted @ 2025-06-10 15:59
大数据从业者FelixZh
阅读(126)
评论(0)
推荐(0)
        
            
        
        
摘要:        
1. 硬件优化1.1 内存分配Elasticsearch 对内存的需求较高,建议分配足够的堆内存。默认情况下,Elasticsearch 会使用系统内存的 50% 作为堆内存,但不要超过 32GB(因为 JVM 的指针压缩机制在 32GB 以下更高效)。 修改 JVM 堆内存:编辑 elastics    阅读全文
posted @ 2025-06-10 14:02
大数据从业者FelixZh
阅读(285)
评论(0)
推荐(0)
        
 
                     
                    
                 
                    
                
 
 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号