随笔分类 - solr-guide
摘要:1. SpellCheck SpellCheck组件设计的目的是基于其他,相似,terms来提供内联查询建议.这些建议的依据可以是solr字段中的terms,外部可以创建文本文件,或者其实lucene索引. 1.1 配置SpellCheckComponent 1.1.1 在solrconfig....
阅读全文
摘要:1.拼写检查 SpellCheck旨在提供一个内联的基于其他,相似,terms的提示.这些提示的基础可以是solr字段中的terms,可以是外部创建要给文本文件,也可以是其他Lucene索引文件. 1.1 配置SpellCheckComponent组件 在solrconfig.xml文件中定义....
阅读全文
摘要:1 高亮 solr的高亮允许匹配用户查询的文档的片段包含在查询响应中返回,高亮包含在返回结果的单独部分(highlighting部分). solr提供了一个高亮工具的集合,这个工具允许控制大量字段的片段,片段的大小和片段的格式.高亮工具还可以被多种请求处理程序(Request Handler)调...
阅读全文
摘要:1. 分面(Faceting) 分面就是将搜索结果基于索引中的terms按类整理.搜索结果带有索引的term,没有term都带有该term匹配的文档数.分面使用户更容易探究搜索结果,缩小查询结果范围以达到更精确的搜索. 1.1 General Parameters 这里介绍了控制分面的基本参数:...
阅读全文
摘要:1. 局部参数 Local parameters是在solr请求中指定一个查询参数.Local parameters提供了一个方式以添加元数据到某个参数类型中,如查询字符串(在solr文档中,Local parameters 有时作为LocalParams关联). Local parameter...
阅读全文
摘要:Parsers 除了主查询解析器外,还有一些其他的查询解析器可以使用或者和主查询解析器连合使用.这部分描述了其他查询解析器的细节,并且给出了一些例子: 大多数的解析器都可以使用局部查询参数的方式来表达(Local Parameters in query).1.1 Block Join Query...
阅读全文
摘要:1 . Function Queries 函数查询使你可以使用一个或者多个数字字段的实际的值生成一个关联的得分(score),函数查询支持DixMax,eDisMax,标准的查询解析. 函数查询使用函数,函数可以是常量(数字或字符文字),一个字段,另一个函数,一个替换参数的参数.也可以使用这个...
阅读全文
摘要:1. 查询语法和解析 这部分主要说明了如何指定被使用的查询解析器.同样描述了主查询解析器的支持的语法和功能.同时还描述了在特定环境下使用的其他查询解析器.这里有一些普通查询解析器都能使用的参数,将会在Common Query Parameters中介绍. 这里讨论的解析器如下:The Stand...
阅读全文
摘要:1. 相关性 相关性是一个查询响应满足用户搜索信息的一个度(程度). 查询响应的相关性主要依赖于上下文的查询.单个搜索应用程序可以通过用户的不同需求和期望被用来在不同的上下文。例如,气候数据的搜索引擎可能由长期研究气候的大学研究人员使用,也可能被关心春天的最后一个霜冻的日期的农民使用,也可能被关...
阅读全文
摘要:1. Velocity Search UI solr包含了一个简单的搜索UI界面,是基于VelocityResponseWrite(也被叫做 Solritas)的.这里演示了几个有用的功能,如搜索,分面,高亮,自动完成和空间位置搜索. 可以通过http://localhost:8983/solr...
阅读全文
摘要:1. Overview of Searching in Solr 在用户运行一个solr搜索时,搜索查询会被request handler处理.一个request handler就是一个请求处理插件,这个插件定义了在solr处理请求时的请求处理逻辑 .solr支持多种request handler...
阅读全文
摘要:1.6.1 什么是 Indexing 1.6.2 Uploading Data with Index Handlers 1.6.3 Uploading Data with Solr Cell using Apache Tika 1.6.4 Uploading Structured Data...
阅读全文
摘要:1. UIMA 集成 你可以使用solr集成Apache的非结构化信息管理架构(UIMA).UIMA可以让你定义自己的分析引擎通道,逐步添加元数据到文档的标注. 关于Solr UIMA的更多信息,参考https://wiki.apache.org/solr/SolrUIMA.1.1 Config...
阅读全文
摘要:1. Content Streams 当RequestHandlers请求基于URL路径来访问时,SolrQueryRequest包含了请求的参数,同样包含了ContentStreams(包含了大容量数据)列表.1.1 Stream Sources 目前RequestHandlers可以通过多种...
阅读全文
摘要:1. Detecting Languages During Indexing 在索引的时候,solr可以使用langidUpdateRequestProcessor来识别语言,然后映射文本到特定语言的字段.solr支持这个功能的两个实现:Tika的语言解析功能:http://tika.apache...
阅读全文
摘要:1. 重复数据删除 solr通过类的类型来支持重复数据删除技术的.一个Signature可以通过以下几种方式实现:方法描述MD5Signature128位hash用于副本探测解析.Lookup3Signature64位hash用于副本探测解析.比MD5更快,索引更小.TextProfileSign...
阅读全文
摘要:1. Updating Parts of Documents 有时候你想要直接改变solr文档中的部分内容,solr有两种合适的方法来改变. 第一种:自动更新,这个方法允许仅仅改变文档的一个或者几个字段,而不需要重建整个文档的索引. 第二种:叫做开放式并发或者是乐观锁机制.它是许多NoSQL数...
阅读全文
摘要:1.使用DIH上传结构化数据 许多搜索应用索引结构化数据,如关系型数据库.DIH提供了一个这样的存储并索引结构化数据的机制.除了关系型数据库,solr可以索引来自HTTP的内容,基于数据源如RSS和ATOM feeds,e-mail库和结构化XML(可以使用XPath来生成字段) 更多信息参考 ...
阅读全文
摘要:1. Uploading Data with Solr Cell using Apache Tika solr使用Apache Tika工程的代码提供了一个框架,用于合并所有不同格式的文件解析器为solr自己的解析器,如Apache PDFBox,Apache POI.通过这个框架,solr使用E...
阅读全文
摘要:1.Uploading Data with Index Handlers 索引处理器就是Request Handlers,用于添加,更新,删除索引中的文档.另外,使用Tika抽取富文档数据,使用Data Import Handler抽取结构化数据.solr自然也就支持XML, CSV 和 JSON...
阅读全文