会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
李克华
云计算高级群: 292870151 195907286 交流:Hadoop、NoSQL、分布式、lucene、solr、nutch
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
···
26
下一页
2015年6月4日
maven私服搭建
摘要: 一、软件安装 地址:http://www.sonatype.org/nexus/thank-you-for-downloading/?dl=tgz 解压: 启动: >> nexus start 打开:http://192.9.104.17:8081/nexus/#welcome...
阅读全文
posted @ 2015-06-04 18:17 李克华
阅读(40542)
评论(0)
推荐(1)
2015年5月8日
HashMap实现原理分析(转)
摘要: 文章转自:http://blog.csdn.net/vking_wang/article/details/141665931. HashMap的数据结构数据结构中有数组和链表来实现对数据的存储,但这两者基本上是两个极端。 数组数组存储区间是连续的,占用内存严重,故空间复杂的很大。但数组的二分查找时间...
阅读全文
posted @ 2015-05-08 14:05 李克华
阅读(690)
评论(0)
推荐(0)
2015年5月6日
自定义评分器Similarity,提高搜索体验(转)
摘要: 文章转自:http://blog.csdn.net/duck_genuine/article/details/6257540首先说一下lucene对文档的评分规则:score(q,d) = coord(q,d) ·queryNorm(q) ·∑(tf(t in d) ·idf(t)2·t.getB...
阅读全文
posted @ 2015-05-06 17:10 李克华
阅读(1709)
评论(0)
推荐(0)
在Solr中配置和使用ansj分词
摘要: 在上一节【编译Ansj之Solr插件】中介绍如何编译ansj分词在solr(lucene)环境中使用的接口,本章将介绍如何在solr中使用ansj,其步骤主要包括:下载或者编译ansj和nlp-lang等jar包、在schema中配置相关类型、将ansj和nlp-lang等jar包配置到solr...
阅读全文
posted @ 2015-05-06 10:47 李克华
阅读(7090)
评论(0)
推荐(2)
2015年5月5日
编译Ansj之Solr插件
摘要: Ansj是一个比较优秀的中文分词组件,具体情况就不在本文介绍了。ansj作者在其官方代码中,提供了对lucene接口的支持。如果用在Solr下,还需要简单的扩展一下。1、基于maven管理 ansj是基于maven进行开发管理的。我们首先修改一下其pom.xml,具体如下所示: 4.0.0 ...
阅读全文
posted @ 2015-05-05 15:31 李克华
阅读(2448)
评论(0)
推荐(0)
使用jMeter测试Solr服务接口
摘要: 之前一直用ab做简单的服务接口测试,ab功能强悍,使用简单,但是没有生成专题图和表格等功能,因此,我们决定使用jmeter来作为我们测试工具。接下来,我们将详细介绍jmeter使用的步骤,主要包括:jmeter部署、模拟用户并发访问、http测试请求、监控测试结果这几部分。1、Jmeter部署安...
阅读全文
posted @ 2015-05-05 11:32 李克华
阅读(3355)
评论(0)
推荐(1)
2015年4月29日
Solrj和Solr DIH索引效率对比分析
摘要: 测试软件环境: 1、16G windows7 x64 32core cpu 。 2、jdk 1.7 tomcat 6.x solr 4.8数据库软件环境: 1、16G windows7 x64 32core cpu 。 2、Oracle 11g一、Solr默认索引工具DIH。...
阅读全文
posted @ 2015-04-29 11:38 李克华
阅读(5687)
评论(0)
推荐(0)
2015年4月8日
Lucene TF-IDF 相关性算分公式(转)
摘要: Lucene在进行关键词查询的时候,默认用TF-IDF算法来计算关键词和文档的相关性,用这个数据排序TF:词频,IDF:逆向文档频率,TF-IDF是一种统计方法,或者被称为向量空间模型,名字听起来很复杂,但是它其实只包含了两个简单规则某个词或短语在一篇文章中出现的次数越多,越相关整个文档集合中包含某...
阅读全文
posted @ 2015-04-08 17:41 李克华
阅读(2675)
评论(0)
推荐(0)
2015年4月2日
关于Lucene 3.0升级到Lucene 4.x 备忘
摘要: 最近,需要对项目进行lucene版本升级。而原来项目时基于lucene 3.0的,很古老的一个版本的了。在老版本中中,我们主要用了几个lucene的东西: 1、查询lucene多目录索引。 2、构建RAMDirectory,把索引放到内存中,以提高检索效率。 3、构建Lucene自定义分词...
阅读全文
posted @ 2015-04-02 17:44 李克华
阅读(3597)
评论(2)
推荐(0)
Lucene 4.x Spellcheck使用说明
摘要: Spellcheck是Lucene新版本的功能,在介绍spellcheck之前,我们需要弄清楚Spellcheck支持几种数据源。Spellcheck构造函数需要传入Dictionary接口: package org.apache.lucene.search.spell;/* * Licens...
阅读全文
posted @ 2015-04-02 16:57 李克华
阅读(1622)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
26
下一页
公告