智慧掩盖真相
天之道,不争而善胜。
博客园
社区
首页
联系
管理
随笔- 86 文章- 24 评论- 867
lucene.net
解读Lucene.Net 阅读索引
摘要: 在使用Lucene的过程中,对Lucene的工作方式产生了越来越浓厚的兴趣。于是尝试阅读其中所有的类,整理其内部结构关系,以期能理解Lucene。
阅读全文
posted @
2008-08-07 22:19
Birdshover 阅读(1769) |
评论 (2)
编辑
基于.Net Framework 3.5的Lucene.Net 中文词组匹配分词器
摘要: 可以自己看看是不是很高效。为了加快速度,尽量精简了算法。测试表明,精确度还可以。
由于没有实现完整的一套字典机制,而是普通的文本字典,所以就不提供完整源码下载了,贴出核心的源码。
阅读全文
posted @
2008-03-25 01:32
Birdshover 阅读(2903) |
评论 (4)
编辑
<
2008年8月
>
日
一
二
三
四
五
六
27
28
29
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
6
与我联系
发短消息
搜索
常用链接
我的随笔
我的空间
我的短信
我的评论
更多链接
我的参与
我的新闻
最新评论
我的标签
留言簿
给我留言
查看留言
我管理的小组
Lucene.Net
我参加的小组
WinForms
.NET 3.x
读书(Books)
设计模式
ZZK支持小组
单元测试
博客园发展小组
Asp.Net MVC
OOAD&UML
我参与的团队
上海.NET俱乐部(2/2199)
山西DotNet俱乐部(0/255)
我的标签
lucene.net(4)
IHttpModule(2)
中文地址乱码(2)
中文分词(2)
Highlighter(1)
分词(1)
mvc(1)
控制台(1)
控制台应用程序(1)
关闭操作(1)
随笔分类
(62)
.Net language and other(13)
(rss)
ASP.Net2.0(15)
(rss)
Desin Patterns(1)
(rss)
lucene.net(2)
(rss)
Thinking about develop(9)
(rss)
WinForm(12)
(rss)
非技术(5)
(rss)
数据(5)
(rss)
文章分类
(27)
.Net 2.0
(rss)
.Net 3.0(1)
(rss)
F#(1)
(rss)
WinForm实验室(9)
(rss)
触摸C# Web开发(2)
(rss)
解读Lucene.Net(5)
(rss)
数独理论研究(1)
(rss)
搜索引擎开发相关(3)
(rss)
摘录资料(5)
(rss)
收藏夹
(1)
我的收藏(1)
(rss)
关注的博客
Terrylee的技术专栏
Tour Dino 的 blog
yurow
yurow
吕震宇
我的百度空间
积分与排名
积分 - 159270
排名 - 220
最新评论
1. re: 话说搜索引擎分词
LZ:我刚学习这个,你说的的文章很好,但是我不知道要怎么划分词,就是怎么去改造?从什么地方下手,望帮助 (陈草原)
2. re: lucene.net 2.0 中文分词后语法高亮问题
LZ :我没有Analyzer analyzer = new MyAnalyzer();
MyAnalyzer 怎么来? (陈草原)
3. re: 如何在Lucene.Net中一个Document使用不同的分词(二)
我搜索的时候,如果有两个相同的字,就要报错,而且搜不准:
比如:有html几个字,我搜索h搜不到 ht也收不到 htm还是不准,非得html才能够,这种有办法解决不? (陈草原)
4. re: Lucene.Net 已经更新到2.3.1 beat版
没找到你说的2.3.1 (webabc)
5. re: Lucene.Net 已经更新到2.3.1 beat版
@凌风
好啊,乐意交流一下 (Birdshover)
6. re: javascript 操作cookie类
@bidaas
呵呵,还是不是很完善,有时间要改改 (Birdshover)
7. re: 详解C#委托,事件与回调函数
@raidsan
如果要求不知道的话,那就得做工厂模式了。
这就好比是做网页里的模板,委托就是那个替换符,看你怎么替换了 (Birdshover)
8. re: javascript 操作cookie类
东西真好用!感谢博主分享 (bidaas)
9. re: 详解C#委托,事件与回调函数
回调 : 调用者既要知道被调用者的类名,又要知道被调用方法名,这样基本上没意义了。 (raidsan)
10. re: Lucene.Net 已经更新到2.3.1 beat版
你好,我加了你QQ.是否可以与你学习、交流一下呢? (凌风)
11. re: 解读Lucene.Net 阅读索引
@new 维生素C.net()
好啊 (Birdshover)
12. re: 解读Lucene.Net 阅读索引
可否邀请您加入博客园新手Team团队? (new 维生素C.net())
13. re: 联想旭日C467A笔记本散热
楼主很细心阿,最近要去买联想的笔记本,款式还没有选好,销售员说现在联想的本本已经用上IBM的技术了,价格实惠。呵呵,俺就支持国产一次。希望不会出现你上面的问题,我自己可不会修阿。我是在沪江网看到你的。 (clara)
14. re: 解读Lucene.Net——说明
@lexus
不是我做的,呵呵 (Birdshover)
15. re: 解读Lucene.Net —— 一、 Directory 之一
@Anders Liu
这里不是为了这么精确控制时间,而只是为了计算出不一样的t2来,这里应该是做过测试,用多长时间是最好的,当然,每台pc做出来的效果可能并不一样。 (Birdshover)
16. re: 解读Lucene.Net —— 一、 Directory 之一
Thread.Sleep貌似不能这么精确地控制时间吧?它好像只是“建议”系统多久之后切换回当前线程。 (Anders Liu)
17. re: 解读Lucene.Net —— 一、 Directory 之一
支持。 (红尘中迷茫)
18. re: 解读Lucene.Net——说明
zzk是你搞的吗? (lexus)
19. re: 谈谈C#的数值类型——顺便给for循环做个补充
无聊,没啥好提的。还放到主页,靠。现在主页的文章怎么越来越差! (我是怪怪)
20. re: 谈谈C#的数值类型——顺便给for循环做个补充
哥们儿,这个确实没啥好值得一提的。 (×lsp)