随笔分类 -  solr

摘要:1. 使用函数df(field,keyword) 和idf(field,keyword).http://118.85.207.11:11100/solr/mobile/select?q={!func}product%28idf%28title,%E9%97%AE%E9%A2%98%29,tf%28t... 阅读全文
posted @ 2015-03-31 18:12 勿妄 阅读(1414) 评论(0) 推荐(0)
摘要:需求: solr索引中的每个文档都有一个时间字段,这个时间字段是知识的有效期时间.如creatime;要求在查询的时候将当前时间和creatime这个字段的时间做对比,如果当前时间大于creattime这个时间,说明这个知识为过期知识,小于这个时间段的为有效知识.我们查询有效知识.解决方法:我采用函... 阅读全文
posted @ 2015-03-30 14:27 勿妄 阅读(458) 评论(0) 推荐(0)
摘要:使用类:public class FunctionRangeQParserPlugin extends QParserPlugin通过函数创建一个范围查询: 其他参数: l, 下限范围,可选) u, 上限范围,可选) incl, 包含下限:true/false,可选,默认为true incu, 包含... 阅读全文
posted @ 2015-03-30 14:25 勿妄 阅读(218) 评论(0) 推荐(0)
摘要:1.1.tomcat部署1 参考文档:solr安全机制1.1.1.加上安全机制的必要性在前面有提到,Solr本身是不加安全机制的,所有的查詢、admin、update這些指令都可以經由url打進去,所以如果不加以控管直接讓Solr上網,相信搜尋引擎裡面的Index很快就會被人路過刪除了.所以如果你... 阅读全文
posted @ 2015-03-24 16:57 勿妄 阅读(634) 评论(0) 推荐(0)
摘要:1.Uploading Data with Index Handlers 索引处理器就是Request Handlers,用于添加,更新,删除索引中的文档.另外,使用Tika抽取富文档数据,使用Data Import Handler抽取结构化数据.solr自然也就支持XML, CSV 和 JSON... 阅读全文
posted @ 2015-03-02 10:30 勿妄 阅读(359) 评论(0) 推荐(0)
摘要:这部分描述了建立索引的过程:添加内容到solr索引中,如果有需要,修改内容或者删除它.通过添加内容到索引里边,我们使其内容可以搜索. solr索引能够接收不同来源的数据,xml文件,逗号分隔值的(CVS)文件,数据库,普通格式文件如Word或者PDF. 这里有三种不同的方式来加载数据到索引中... 阅读全文
posted @ 2015-03-02 09:46 勿妄 阅读(288) 评论(0) 推荐(0)
摘要:语言分析器(Analyzer) 这部分包含了分词器(tokenizer)和过滤器(filter)关于字符转换和使用指定语言的相关信息.对于欧洲语言来说,tokenizer是相当直接的,Tokens被空格或者是一个简单的连接字符设置分隔的.在其他语言中,分词规则就不是那么简单了,一些欧洲语言也可能指... 阅读全文
posted @ 2015-02-27 10:23 勿妄 阅读(639) 评论(0) 推荐(0)
摘要:CharFilterFactories 字符过滤器是一个预处理输入字符的组件,字符过滤器可以链接如token过滤器,并放置在Tokenizer(分词器)的前面,字符过滤器可以添加,更改或删除字符,同时保留原有的字符偏移量,以支持如高亮的功能.solr.MappingCharFilterFactor... 阅读全文
posted @ 2015-02-27 10:22 勿妄 阅读(264) 评论(0) 推荐(0)
摘要:Filters 过滤器filter应该跟在tokenizer或者另一个filter之后.因为它们将TokenStream作为输入源. ... class属性命名了一个工厂类用来实例化一个filter对象.Filter工厂类必须实现org... 阅读全文
posted @ 2015-02-27 10:21 勿妄 阅读(399) 评论(0) 推荐(0)
摘要:Tokenizers Tokenizer的工厂类实现了org.apache.solr.analysis.TokenizerFactory.一个TokenizerFactory的create()方法接受一个Reader返回一个TokenStream.在... 阅读全文
posted @ 2015-02-27 09:06 勿妄 阅读(776) 评论(0) 推荐(0)
摘要:什么是Filter--过滤器 像分词器(tokenizer)一样,过滤器(filter)消耗输入,产生token流.过滤器同样从org.apache.lucene.analysis.TokenStream中产生.和tokenizer不同的是,filter的输入是一个Tokenizer.filter... 阅读全文
posted @ 2015-02-27 09:04 勿妄 阅读(477) 评论(0) 推荐(0)
摘要:什么是Tokenizer-分词 分词器的工作就是分解文本流成词(tokens).在这个文本中,每一个token都是这些字符的一个子序列.一个分析器(analyzer)必须知道它所配置的字段,但是tokenizer不需要,分词器(tokenizer)从一个字符流(reader)读取数据,生成一个To... 阅读全文
posted @ 2015-02-27 09:03 勿妄 阅读(9334) 评论(0) 推荐(0)
摘要:分析器检查字段的文本,然后生成一个token流.在schema.xml中,分析器作为的一个子元素.在普通的使用当中,只有字段类型solr.TextField使用分析器.配置分析器最简单的方式就是使用一个元素,它的class属性是一个java的类名. 在这个例子中,类Whitespa... 阅读全文
posted @ 2015-02-27 07:38 勿妄 阅读(695) 评论(0) 推荐(0)
摘要:字段分析器(Analyzers)即用于文档索引也用于查询.一个分析器检查字段的文本,并生成一个token流.分析器可能是一个单独的类,也可能是一系列的tokenizer和filter的组合. 分词器把字段数据分解成词汇单元或者tokens,过滤器(filters)检查tokens流,并且保持它... 阅读全文
posted @ 2015-02-25 21:06 勿妄 阅读(495) 评论(0) 推荐(0)
摘要:这部分介绍了solr如何分解和处理文本数据的,它包含一下主题: 1.5.1 Analyzers,Tokenizers,Filters概述:主要介绍Analyzers,Tokenizers,Filters的概念. 1.5.2 什么是Analyzer(分析器):solr Analyzer的细节信... 阅读全文
posted @ 2015-02-25 20:09 勿妄 阅读(1019) 评论(0) 推荐(0)
摘要:Documents,Fields和Schema概述 solr的基本前提是非常简单,你可以给它很多信息,然后可以向它提出问题,获取你想要的问题的信息.所有信息输入的地方就叫做索引或者更新.当你提出问题时,叫做查询. 一种理解solr工作原理的方式就是考虑一本食谱的活页本.每次添加一个新的食谱,就会... 阅读全文
posted @ 2015-02-19 21:16 勿妄 阅读(358) 评论(0) 推荐(0)
摘要:1.4.1.Documents,Fields和Schema概述1.4.2 solr字段类型1.4.2 solr字段类型--(1.4.2.1)字段类型定义和字段类型属性1.4.2 solr字段类型--(1.4.2.2)solr附带的字段类型1.4.2 solr字段类型--(1.4.2.3)使用货币和汇... 阅读全文
posted @ 2015-02-19 21:09 勿妄 阅读(226) 评论(0) 推荐(0)
摘要:Schemaless模式 schemaless模式是一组solr功能的集合,允许用户通过简单的索引例子数据快速构建一个有效的schema,而不需要手动的编辑schema.这些solr功能都是在solrconfig.xml中指定的.主要是: schema管理:schema修改是通过Solr API... 阅读全文
posted @ 2015-02-11 23:15 勿妄 阅读(4057) 评论(0) 推荐(0)
摘要:DocValues 在solr4.2以后,引入了一个令人兴奋的功能,这个功能在lucene存在已经一段时间了,但是还没有在solr中使用. 在某些方面,DocValue 是一种非常有效的索引方式.为什么用DocValues? 标准的建立索引方式是一中倒排序索引方式,这种方式就是对索引中的所有文... 阅读全文
posted @ 2015-02-11 23:14 勿妄 阅读(1223) 评论(0) 推荐(0)
摘要:putting the pieces together 在最高的级别,schema.xml结构如下, 明显的,这最重要的内容是在types和fields中,也就是字段类型和实际字段定义存在的地方.这些字段也可以通过copyFields补充,夹在字段... 阅读全文
posted @ 2015-02-11 23:13 勿妄 阅读(293) 评论(0) 推荐(0)