上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 16 下一页
摘要: 在之前的两个部分(part1、part2)中,我们学会了如何配置和查询solr来获取自动完成的功能。今天,我们来看一下如果为suggester添加字段,以这种方式来提供自动完成的功能。组件配置在上一期的配置组件中添加如下的参数:<str name="sourceLocation">dict.txt</str> 这样我们的配置就变成了:<searchComponent name="suggest" class="solr.SpellCheckComponent"> <lst name=" 阅读全文
posted @ 2011-11-30 15:03 爱开卷360 阅读(5748) 评论(3) 推荐(0) 编辑
摘要: 在Solr的自动完成/自动补充实现介绍(第一部分)中我介绍了怎么用faceting的机制来实现自动完成(autocomplete)的功能,今天我们来看一下如何用Suggester的组件来实现自动完成功能.开始这里有一点需要提醒:Suggest组件在1.4.1或以下版本不可用。要使用这个组件,你需要下载3_x或lucene/solr的主干版本。配置在索引配置之前,我们定义一个searchComponent:<searchComponent name="suggest" class="solr.SpellCheckComponent"> < 阅读全文
posted @ 2011-11-30 14:41 爱开卷360 阅读(10018) 评论(5) 推荐(1) 编辑
摘要: 大部分人已经见过自动完成(autocomplete)的功能了(见下图),solr提供了构建这个功能的机制。今天,我将给你展示如何使用facet的方式来添加自动完成机制。索引设想你想在你的在线商店中,给用户一些提示,比如商品的名称。假设我们的索引构建如下:<field name="id" type="string" indexed="true" stored="true" multiValued="false" required="true"/> <field 阅读全文
posted @ 2011-11-30 14:32 爱开卷360 阅读(6043) 评论(2) 推荐(2) 编辑
摘要: 介绍katta 是一个运行在许多商品硬件服务器上的分布式应用,它非常类似于Hadoop MapReduce, Hadoop DFS, HBase, Bigtable 和 Hypertable.概述主节点服务器管理从节点服务器和index shards任务。从节点服务器服务index shards。客户端允许从所有连接的节点上查找数据,并把所有的结果合并成一个结果返回给客户端。数据结构katta的索引是个文件夹,它里面包含一套所谓的index shards(文件形式)。这些子文件包含了Lucene索引。index shards能够很简单的用Lucene的index writer创建。创建一个ka 阅读全文
posted @ 2011-11-29 15:21 爱开卷360 阅读(4078) 评论(4) 推荐(0) 编辑
摘要: 一、总体架构Zoie是一个实时的搜索引擎系统,其需要逻辑上独立的索引和搜索子系统相对紧密的结合在一起,从而使得一篇文档一经索引,就能够立刻被搜索的到。ZoieSystem是Zoie的重要组成部分,其一方面通过实现DataConsumer接口而完成了索引功能,一方面通过实现IndexReaderFactory<ZoieIndexReader<R extends IndexReader>>而完成了搜索功能,并将二者紧密的结合在一起。下面就是ZoieSystem的总体架构图:对于索引系统来讲,ZoieSystem是一个DataConsumer,也即是一个消费者,其有函数con 阅读全文
posted @ 2011-11-29 14:37 爱开卷360 阅读(2341) 评论(1) 推荐(0) 编辑
摘要: Solr的配置网上讲的很多,但是实施总是遇到困难,现总结如下:1.从官网下载solr core的源码包,将solrwar包放到tomcat的webapps文件夹下,其它web容器亦然. 运行tomcat ,解压出来solr的文件夹.2.Single core配置:以solr自带例子做讲解 2.1.新建solrhome目录:d:/test/solrcore/singlecore ,从solr源码的example包下复制solr包 2.2.在tomcat 下的 webappss的solr包 WEB-INF目录下修改web.xml的<env-entry-name>solr/home< 阅读全文
posted @ 2011-11-29 12:36 爱开卷360 阅读(3483) 评论(1) 推荐(0) 编辑
摘要: Apache Solr项目,是一款基于Apache Lucene的开源企业搜索服务器,最近发布了1.3版。InfoQ采访了Solr的创建者Yonik Seeley,了解了新版本的更多信息和Solr提供给最终用户的功能。Seeley首先描述了目标用户:“需要搜索框、分面浏览(导航)或者两者结合的任何人”,Solr的关键特性包括:基于标准的开放接口——Solr搜索服务器支持通过XML、JSON和HTTP查询和获取结果。易管理——Solr可以通过HTML页面管理,服务器统计数据以JMX输出,Solr配置通过XML完成。分面浏览——搜索结果自动分类。突出显示命中词——匹配的字符自动在搜索结果中高亮显示 阅读全文
posted @ 2011-11-29 11:33 爱开卷360 阅读(1099) 评论(0) 推荐(0) 编辑
摘要: 如果想在solr实现像百度一样相似的竟价的排名,也是可以的,在solr中实现竟价排名,主要使用QueryElevationComponent组件,solrconfig.xml配置:<searchComponent name="elevator" class="solr.QueryElevationComponent"> <!-- pick a fieldType to analyze queries --> <str name="queryFieldType">string</str> 阅读全文
posted @ 2011-11-28 15:07 爱开卷360 阅读(3327) 评论(2) 推荐(0) 编辑
摘要: HashSet:哈希表是通过使用称为散列法的机制来存储信息的,元素并没有以某种特定顺序来存放;LinkedHashSet:以元素插入的顺序来维护集合的链接表,允许以插入的顺序在集合中迭代; TreeSet:提供一个使用树结构存储Set接口的实现,对象以升序顺序存储,访问和遍历的时间很快。用例代码:package com.test; import java.util.HashSet; import java.util.LinkedHashSet; import java.util.TreeSet; /** * @description 几个set的比较 * Hash... 阅读全文
posted @ 2011-11-28 13:07 爱开卷360 阅读(21031) 评论(0) 推荐(1) 编辑
摘要: positionIncrement:这个字段决定当前token相对于上一个token的位置(当前token的位置就是上一个token位置的值与positionIncrement的值的和),它的作用主要体现在短语查询(phrase search)中. 一般它的默认值是1.但是可以把它设置为0或者大于1的值,起作用分别如下:当设置为0的时候是一个词有多个词干的情况下(这里指英文).短语查询对短语中的两个词之间的其它词的数量是有严格要求的,如果想进行严格匹配就可能限制为0,即两个词必须紧紧相连.这样如果不认为一个词产生的若干词干是在同一位置,就相当于认为他们是不同的词了,从而导致无法正确的匹配... 阅读全文
posted @ 2011-11-25 14:58 爱开卷360 阅读(1062) 评论(1) 推荐(1) 编辑
上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 16 下一页