上一页 1 2 3 4 5 6 ··· 30 下一页
摘要:使用索引别名和Rollover滚动创建索引 在 "ElasticSearch6.3.2 集群做节点冷(warm) 热(hot) 分离" 中,实现了ElasticSearch集群节点的冷热分离,新创建的索引只允许分配到hot节点上,而随着时间推移,旧的历史索引数据需要迁移到warm节点上。因此,ES索 阅读全文
posted @ 2019-09-14 12:49 hapjin 阅读(1991) 评论(0) 推荐(0) 编辑
摘要:谈谈 Callable 任务是怎么运行的?它的执行结果又是怎么获取的? 向线程池提交Callable任务,会创建一个新线程(执行任务的线程)去执行这个Callable任务,但是通过Future get获取任务的执行结果是在提交任务的调用者线程中,那问题一:调用者线程如何获取执行任务的线程的结果? 在 阅读全文
posted @ 2019-09-06 21:56 hapjin 阅读(2215) 评论(0) 推荐(0) 编辑
摘要:ElasticSearch6.3.2源码分析之节点连接实现 这篇文章主要分析ES节点之间如何维持连接的。在开始之前,先扯一下ES源码阅读的一些心得:在使用ES过程中碰到某个问题,想要深入了解一下,可源码又太多了,不知道从哪里入手,怎么办?ES启动的入口类是Elasticsearch.java,顺着这 阅读全文
posted @ 2019-08-31 15:21 hapjin 阅读(513) 评论(1) 推荐(0) 编辑
摘要:基于word2vec的文档向量模型的应用 word2vec的原理以及训练过程具体细节就不介绍了,推荐两篇文档:《word2vec parameter learning explained》、和《word2vec中的数学》。 在《word2vec中的数学》中谈到了训练语言模型的一些方法:比如n gra 阅读全文
posted @ 2019-08-23 21:40 hapjin 阅读(1792) 评论(0) 推荐(0) 编辑
摘要:拿一个小规模的5节点ES集群做冷热分离尝试,它上面已经有60多个索引,有些索引按月、每月生成一个索引,随着数据的不断写入,历史数据(只需保留三个月数据,三个月之前的数据视为历史数据)越来越占磁盘空间和内存资源,影响搜索响应时间。因此想把集群中节点分成2种类型,一种是hot节点,配置大内存和SSD,用 阅读全文
posted @ 2019-08-10 15:42 hapjin 阅读(3251) 评论(0) 推荐(0) 编辑
摘要:Elasticsearch 定义字段时Norms选项的作用 本文介绍ElasticSearch中2种字段(text 和 keyword)的Norms参数作用。 创建ES索引时,一般指定2种配置信息:settings、mappings。settings 与数据存储有关(几个分片、几个副本);而mapp 阅读全文
posted @ 2019-08-03 14:46 hapjin 阅读(2195) 评论(3) 推荐(1) 编辑
摘要:这篇文章主要是记录HanLP标准分词算法整个实现流程。 HanLP的核心词典训练自人民日报2014语料,语料不是完美的,总会存在一些错误。这些错误可能会导致分词出现奇怪的结果,这时请打开调试模式排查问题: 那什么是语料呢?通俗的理解,就是HanLP里面的二个核心词典。假设收集了人民日报若干篇文档,通 阅读全文
posted @ 2019-07-27 15:01 hapjin 阅读(4289) 评论(0) 推荐(0) 编辑
摘要:"Elasticsearch 通信模块的分析" 从宏观上介绍了ES Transport模块总体功能,于是就很好奇ElasticSearch是怎么把服务启动起来,以接收Client发送过来的Index索引操作、GET获取文档操作 等一系列操作的呢?本文分析:ElasticSearch6.3.2 Net 阅读全文
posted @ 2019-07-20 15:01 hapjin 阅读(2097) 评论(2) 推荐(0) 编辑
摘要:ElasticSearch6.3.2 中的JVM性能调优 前一段时间被人问了个问题:在使用ES的过程中有没有做过什么JVM调优措施? 在我搭建ES集群过程中,参照 "important settings" 官方文档来的,并没有对JVM参数做过多的调整。但谈到JVM配置参数,少不了操作系统层面上的一些 阅读全文
posted @ 2019-07-12 23:19 hapjin 阅读(13601) 评论(0) 推荐(0) 编辑
摘要:ElasticSearch 线程池类型分析之 ResizableBlockingQueue 在上一篇文章 "ElasticSearch 线程池类型分析之 ExecutorScalingQueue" 的末尾,谈到了处理ES 搜索操作(search)的线程池的一些实现细节,本文就以下几个问题分析SEAR 阅读全文
posted @ 2019-07-05 20:56 hapjin 阅读(911) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 30 下一页