随笔分类 - lucene & solr
摘要:前言 随着用户的增多,空间和并发量越来越多,会导致一台solr服务器干不过了。这时候,就需要将solr集群以下。 集群架构 由多台服务器共同完成索引和搜索任务 实现的思路是将索引数据进行shard(分片) 拆分,每个分片由多台的服务器共同完成。 当一个索引或搜索请求过来时会分别从不同的shard的服
阅读全文
摘要:前言 虽然windows下, tomcat和solr整合起来灰常的方便, 但是, 一般像这种东西, 都很少部署在windows中, 更多的是部署到linux中去. 其实, 步骤是一样的, 这里, 我在centos 中再部署一次. 下包 下载地址还是之前的那个: http://mirror.bit.e
阅读全文
摘要:前言: solr服务器搭起来, 数据导入之后, 就该应用到项目中去了. 那在项目中, 该怎么整合和应用solr呢? 接下来, 就来整合和应用solr 一. 整合 1. 引入jar包 2. 配置文件 host 也可以写成 http://127.0.0.1:8081/solr/collection1.
阅读全文
摘要:solr 除了能查询文档中的数据外, 还可以导入数据库中的数据. 也就是说, solr 能查询其他数据库中的数据(solr本身也是一个数据库, 非关系型的). 那接下来就试一下导入mysql数据库中的数据. 一. 准备工作 1. 在solr_core下面新建lib文件夹. 然后将以下jar包拷贝进去
阅读全文
摘要:一. 问题: 在使用solr时, 分词器解析中文的时候, 是一个一个字解析的. 这并不是我们想要的结果. 而在lucene中, 使用的中文分词器是 IKAnalyzer. 那么在solr里面, 是不是任然可以用这个呢. 二. 整合 ik 1. 修改schema配置文件 打开如下路径中的managed
阅读全文
摘要:前面 lucene 初探 都是为了solr打基础的. 虽然lucene 的filter 没有涉及, 但是打基础, 差不多够用了. 一. solr 和 lucene 的区别 这里我就用自己的理解来说了, 可能不全, 但是应该够用了, 网上能搜到官方一点的. 首先, solr 是基于 lucene的.
阅读全文
摘要:lucene初探, 是为了后面solr做准备的. 如果跳过lucene, 直接去看solr, 估计有点懵. 由于时间的关系, lucene查询方法也有多个, 所以单独出来. 一. 精确查询 在查询的时候, 新建一个Term对象, 进去精确匹配. 前一篇提到过, 经过分词器分下来的每一个词或者一段话,
阅读全文
摘要:前言: window文件管理右上角, 有个搜索功能, 可以根据文件名进行搜索. 那如果从文件名上判断不出内容, 我岂不是要一个一个的打开文件, 查看文件的内容, 去判断是否是我要的文件? 几个, 十几个文件还好, 如果是几百个甚至几万上百万, 我也能这么去找么? 这不是找文件了, 而是找不自在, 找
阅读全文