posted @ 2007-04-15 23:39
随笔分类 - 搜索引挚
毕业设计项目
摘要:通过扩展Lucene.net中标准的分词器来实现
效果:
原句:“我是中国人!I am chinese!Email:youpeizun126@126.com;IP:172.17.34.168”
切词效果:
我/是/中国人/中国/中/国/人/I/am/chinese/Email/youpeizun126@126.com/IP/172.17.34.168
阅读全文
摘要:一、中文分词方式
二、Lucene.net中五种中文分词效果代码演示
三、五中分词器代码设计探究
阅读全文
posted @ 2007-03-07 00:03
摘要:我分析了出现乱码的原因,并给出相就解决的代码!跟大家交流交流,有兴趣的看一看,瞧一瞧!
阅读全文
posted @ 2007-01-21 21:15
摘要:演示我做的搜索引挚运行的效果包括:
本地信息的索引与搜索
WEB信息的抓取
WEB信息的索引与搜索
阅读全文
posted @ 2006-11-30 21:34
摘要:参考: http://www.codeproject.com/useritems/Office_To_Text.asp http://channel9.msdn.com/wiki/default.aspx/Channel9.DesktopSearchIFilters http://www.seekafile.org/plug-in-system.html 一个源码学习: 该源码使用了注册...
阅读全文
posted @ 2006-11-06 10:13
摘要:由于毕业设计的做收搜引挚的需要,我对网络机器人或称之为网络蜘蛛的开源项目或者代码示例作了一些收集,我主要需要C#有关这方面的资料,如果你有兴趣的话关注一下,或者你对这方面有熟悉,别忘了共亨点信息给我哦!谢谢!【Java开源 Web爬虫】列表http://www.ideagrace.com/sf/web-crawler/http://www.cs.cmu.edu/~rcm/websp...
阅读全文
posted @ 2006-10-31 23:17