旋风

Communication comes from our hears and heads! my msn:youpeizun@hotmail.com


posts - 81, comments - 298, trackbacks - 22, articles - 1

搜索引挚之代码设计

Posted on 2006-12-01 10:03 xuanfeng 阅读(2345) 评论(12)  编辑 收藏 所属分类: 搜索引挚
  类的关系图:


类的详细信息:
1.
文件内容提取类(myParser

2. 创建本地文件索引类(CreateFileIndex

3.搜索本地文件类(FileSearcher

4.输出索引文件计录集合类(PrintIndex) 
 

5.页面信息处理类(TreateHTML


6.网爬类

Crawl



7.创建Web内容索引类()

8.搜索Web内容类

结束!

Feedback

#1楼    回复  引用    

2006-12-01 10:20 by 强! [未注册用户]
非常好!

#2楼    回复  引用  查看    

2006-12-01 10:32 by Jason Cui      
不知道抓到网页以后,如果取它的标题和内容部分?

#3楼    回复  引用  查看    

2006-12-01 10:32 by Sunlight      
很不错,但好像很难看懂

#4楼    回复  引用    

2006-12-01 10:40 by 信息谷 [未注册用户]
放首页一次就够了,干吗要发了一条 又一条,还都放到首页
我看你是想让大家点你的 GoogleAD吧

#5楼 [楼主]   回复  引用  查看    

2006-12-01 11:03 by xuanfeng      
@Jason Cui
请看TreateHTML类

@信息谷
我觉得用心写过的东西,就会放在首页与大家共亨自己想法并已在和大家交流,并非限定在我写了一篇还是N篇,并且我都以简要的方式发布,并不会占用首页很大的空间。

#6楼    回复  引用    

2006-12-01 11:31 by 信息谷 [未注册用户]
那就把你的那个烂广告去掉!!!!
类关系图下一个广告
网爬类下还一个广告
还隐藏的这么好 生怕 别人点不到似的

#7楼    回复  引用  查看    

2006-12-01 12:05 by Eunge      
广告无可非议,每个人都有自己的自由,这是Weblog!

#8楼    回复  引用  查看    

2006-12-01 13:58 by gozh2002      
are you using lucene?
is there a good threading-pool support?

#9楼    回复  引用    

2006-12-01 14:43 by wav [未注册用户]
能否提供程序的下载?多些说明。

#10楼 [楼主]   回复  引用  查看    

2006-12-01 16:11 by xuanfeng      
@gozh2002
No!I use lucene's .net edition!It is a excellent seacher framework!
@wav
请看主页的另一篇随笔!

#11楼    回复  引用  查看    

2006-12-01 21:53 by Wisdom-zh      
呵呵,这样做广告,有新意啊!!!
学习中。。。

#12楼    回复  引用  查看    

2007-01-21 11:56 by 海纳百川      
楼主写的不错学习中,最好能系统的写篇文章来供网友学习。

标题  
姓名  
主页
Email (只有博主才能看到) 
验证码 *  看不清,换一张 [登录][注册]
内容(请不要发表任何与政治相关的内容)  
  登录  使用高级评论  新用户注册  返回页首  恢复上次提交      
该文被作者在 2006-12-01 11:56 编辑过