雨中漫步的太阳
雨中漫步,笑看人生百态,优哉游哉
博客园
社区
首页
新随笔
联系
管理
订阅
随笔- 39 文章- 7 评论- 79
我的标签
: KTDictSeg
使用肖波的KTDictSeg分词器 为Lucene.net服务
雨中漫步的太阳 2008-03-25 10:25 阅读:525 评论:4
公告
我的最新闪存
北京人总有那么几个装B的
10-13 09:16
<
2008年10月
>
日
一
二
三
四
五
六
28
29
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
6
7
8
与我联系
发短消息
搜索
常用链接
我的随笔
我的空间
我的短信
我的评论
更多链接
我的文章
我的参与
我的新闻
最新评论
我的标签
留言簿
给我留言
查看留言
我参加的小组
Lucene
设计模式
LumaQQ.NET
jQuery
搜索引擎
iBATIS.NET
ASP.NET
我的标签
Lucene.net(1)
KTDictSeg(1)
随笔档案
(39)
2008年10月 (1)
2008年9月 (1)
2008年8月 (4)
2008年7月 (6)
2008年5月 (10)
2008年4月 (15)
2008年3月 (1)
2008年1月 (1)
文章档案
(6)
2008年1月 (6)
朋友的园子
eaglet
(rss)
王向军
(rss)
最新随笔
1. 发现lucene2.32 java版本一个小小的bug
2. 结合 ictclass4j 和 KTDictSeg 写自己的分词器----断句(1)
3. 布隆过滤器
4. 数据库中查询的字段中含有单引号的处理方式
5. js的优化后的replace函数
6. 关于form的enctype="multipart/form-data"的处理
7. 自己动手实现 lucene 搜索代码高亮显示
8. xml 文件正确性验证类实现
9. Http协议中的方法 转载
10. oracle 迷你客户端傻瓜式安装配置 下载
积分与排名
积分 - 17851
排名 - 2266
最新评论
1. re: System.Web.HttpContext.Current.Session为NULL值的问题?
哥们,我加上了,还是不行啊, (游侠_1)
2. re: 结合 ictclass4j 和 KTDictSeg 写自己的分词器----断句(1)
竟然 看到了 分词的文章,へへ☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆最近在搜索关于提取单词 的一些算法和开源软件LZ如果有好的网站 或者是 资源 可否告诉我一些先谢谢了... (fesing)
3. re: 结合 ictclass4j 和 KTDictSeg 写自己的分词器----断句(1)
修正一点问题:上文多出用到类似下面的判断: while(!arr.get(index+1).equals(".")&&p.matcher(arr.get(index... (雨中漫步的太阳)
4. re: 结合 ictclass4j 和 KTDictSeg 写自己的分词器----断句(1)
Java下有庖丁解牛,那个分词组件还不错 (chester60)
5. re: 结合 ictclass4j 和 KTDictSeg 写自己的分词器----断句(1)
@ eaglet
谢谢哦,随着我分析的深入,有看不懂的地方,一定不会跟你客气 呵呵
(雨中漫步太阳)
阅读排行榜
1. oracle 迷你客户端傻瓜式安装配置 下载(1711)
2. 一个字符串str="fsdafdsaf" 任意个字符,求出这个字符串中出现次数最多的字符和出现的次数(1333)
3. 自己动手实现 lucene 搜索代码高亮显示(1282)
4. UserData使用总结[转载-lanyu](1195)
5. 结合 ictclass4j 和 KTDictSeg 写自己的分词器----断句(1)(1115)
评论排行榜
1. oracle 迷你客户端傻瓜式安装配置 下载(31)
2. 一个字符串str="fsdafdsaf" 任意个字符,求出这个字符串中出现次数最多的字符和出现的次数(8)
3. 自己动手实现 lucene 搜索代码高亮显示(8)
4. 避免因索引制作过程中出现错误而影响搜索(7)
5. 结合 ictclass4j 和 KTDictSeg 写自己的分词器----断句(1)(6)
60天内阅读排行
1. 结合 ictclass4j 和 KTDictSeg 写自己的分词器----断句(1)(1115)
2. 发现lucene2.32 java版本一个小小的bug(788)
3. 数据库中查询的字段中含有单引号的处理方式(129)
4. 关于form的enctype="multipart/form-data"的处理(99)
5. 布隆过滤器(95)