随笔列表第10页 - 爱开卷360

2011年11月30日

摘要：在之前的两个部分(part1、part2)中,我们学会了如何配置和查询solr来获取自动完成的功能。今天，我们来看一下如果为suggester添加字段，以这种方式来提供自动完成的功能。组件配置在上一期的配置组件中添加如下的参数：<str name="sourceLocation">dict.txt</str> 这样我们的配置就变成了：<searchComponent name="suggest" class="solr.SpellCheckComponent"> <lst name=" 阅读全文

posted @ 2011-11-30 15:03 爱开卷360 阅读(5748) 评论(3) 推荐(0) 编辑

Solr的自动完成实现方式（第二部分：Suggester方式）

摘要：在Solr的自动完成/自动补充实现介绍(第一部分)中我介绍了怎么用faceting的机制来实现自动完成(autocomplete)的功能，今天我们来看一下如何用Suggester的组件来实现自动完成功能.开始这里有一点需要提醒：Suggest组件在1.4.1或以下版本不可用。要使用这个组件，你需要下载3_x或lucene/solr的主干版本。配置在索引配置之前，我们定义一个searchComponent：<searchComponent name="suggest" class="solr.SpellCheckComponent"> < 阅读全文

posted @ 2011-11-30 14:41 爱开卷360 阅读(10018) 评论(5) 推荐(1) 编辑

Solr的自动完成实现方式（第一部分：facet方式）

摘要：大部分人已经见过自动完成(autocomplete)的功能了(见下图)，solr提供了构建这个功能的机制。今天，我将给你展示如何使用facet的方式来添加自动完成机制。索引设想你想在你的在线商店中，给用户一些提示，比如商品的名称。假设我们的索引构建如下：<field name="id" type="string" indexed="true" stored="true" multiValued="false" required="true"/> <field 阅读全文

posted @ 2011-11-30 14:32 爱开卷360 阅读(6043) 评论(2) 推荐(2) 编辑

2011年11月29日

Katta：基于Lucene可伸缩分布式实时搜索方案

摘要：介绍katta 是一个运行在许多商品硬件服务器上的分布式应用，它非常类似于Hadoop MapReduce, Hadoop DFS, HBase, Bigtable 和 Hypertable.概述主节点服务器管理从节点服务器和index shards任务。从节点服务器服务index shards。客户端允许从所有连接的节点上查找数据，并把所有的结果合并成一个结果返回给客户端。数据结构katta的索引是个文件夹，它里面包含一套所谓的index shards（文件形式）。这些子文件包含了Lucene索引。index shards能够很简单的用Lucene的index writer创建。创建一个ka 阅读全文

posted @ 2011-11-29 15:21 爱开卷360 阅读(4078) 评论(4) 推荐(0) 编辑

Zoie：基于Lucene实时的搜索引擎系统

摘要：一、总体架构Zoie是一个实时的搜索引擎系统，其需要逻辑上独立的索引和搜索子系统相对紧密的结合在一起，从而使得一篇文档一经索引，就能够立刻被搜索的到。ZoieSystem是Zoie的重要组成部分，其一方面通过实现DataConsumer接口而完成了索引功能，一方面通过实现IndexReaderFactory<ZoieIndexReader<R extends IndexReader>>而完成了搜索功能，并将二者紧密的结合在一起。下面就是ZoieSystem的总体架构图：对于索引系统来讲，ZoieSystem是一个DataConsumer，也即是一个消费者，其有函数con 阅读全文

posted @ 2011-11-29 14:37 爱开卷360 阅读(2341) 评论(1) 推荐(0) 编辑

Apache Solrj EmbeddedSolrServer使用

摘要： Solr的配置网上讲的很多，但是实施总是遇到困难，现总结如下：1.从官网下载solr core的源码包，将solrwar包放到tomcat的webapps文件夹下，其它web容器亦然. 运行tomcat ,解压出来solr的文件夹.2.Single core配置：以solr自带例子做讲解 2.1.新建solrhome目录:d:/test/solrcore/singlecore ,从solr源码的example包下复制solr包 2.2.在tomcat 下的 webappss的solr包 WEB-INF目录下修改web.xml的<env-entry-name>solr/home< 阅读全文

posted @ 2011-11-29 12:36 爱开卷360 阅读(3483) 评论(1) 推荐(0) 编辑

Solr的创建者介绍Apache Solr : 基于Lucene的可扩展集群搜索服务器

摘要： Apache Solr项目，是一款基于Apache Lucene的开源企业搜索服务器，最近发布了1.3版。InfoQ采访了Solr的创建者Yonik Seeley，了解了新版本的更多信息和Solr提供给最终用户的功能。Seeley首先描述了目标用户：“需要搜索框、分面浏览（导航）或者两者结合的任何人”，Solr的关键特性包括：基于标准的开放接口——Solr搜索服务器支持通过XML、JSON和HTTP查询和获取结果。易管理——Solr可以通过HTML页面管理，服务器统计数据以JMX输出，Solr配置通过XML完成。分面浏览——搜索结果自动分类。突出显示命中词——匹配的字符自动在搜索结果中高亮显示阅读全文

posted @ 2011-11-29 11:33 爱开卷360 阅读(1099) 评论(0) 推荐(0) 编辑

2011年11月28日

Apache Solr实现竞价排名

摘要：如果想在solr实现像百度一样相似的竟价的排名，也是可以的，在solr中实现竟价排名，主要使用QueryElevationComponent组件,solrconfig.xml配置：<searchComponent name="elevator" class="solr.QueryElevationComponent">  <str name="queryFieldType">string</str> 阅读全文

posted @ 2011-11-28 15:07 爱开卷360 阅读(3327) 评论(2) 推荐(0) 编辑

【JAVA基础】HashSet、LinkedHashSet、TreeSet使用区别

摘要： HashSet：哈希表是通过使用称为散列法的机制来存储信息的，元素并没有以某种特定顺序来存放；LinkedHashSet：以元素插入的顺序来维护集合的链接表，允许以插入的顺序在集合中迭代； TreeSet：提供一个使用树结构存储Set接口的实现，对象以升序顺序存储，访问和遍历的时间很快。用例代码：package com.test; import java.util.HashSet; import java.util.LinkedHashSet; import java.util.TreeSet; /** * @description 几个set的比较 * Hash... 阅读全文

posted @ 2011-11-28 13:07 爱开卷360 阅读(21031) 评论(0) 推荐(1) 编辑

2011年11月25日

【Lucene词汇解释】positionIncrement用法

摘要： positionIncrement：这个字段决定当前token相对于上一个token的位置(当前token的位置就是上一个token位置的值与positionIncrement的值的和),它的作用主要体现在短语查询(phrase search)中. 一般它的默认值是1.但是可以把它设置为0或者大于1的值,起作用分别如下:当设置为0的时候是一个词有多个词干的情况下(这里指英文).短语查询对短语中的两个词之间的其它词的数量是有严格要求的,如果想进行严格匹配就可能限制为0,即两个词必须紧紧相连.这样如果不认为一个词产生的若干词干是在同一位置,就相当于认为他们是不同的词了,从而导致无法正确的匹配... 阅读全文

posted @ 2011-11-25 14:58 爱开卷360 阅读(1062) 评论(1) 推荐(1) 编辑

爱开卷360

好文章 • 爱开卷 • 360Tech

公告