旋风

Communication comes from our hears and heads! my msn:youpeizun@hotmail.com


posts - 90, comments - 352, trackbacks - 27, articles - 1

搜索引挚之代码设计

Posted on 2006-12-01 10:03 xuanfeng 阅读(2454) 评论(12)  编辑 收藏 网摘 所属分类: 搜索引挚
  类的关系图:


类的详细信息:
1.
文件内容提取类(myParser

2. 创建本地文件索引类(CreateFileIndex

3.搜索本地文件类(FileSearcher

4.输出索引文件计录集合类(PrintIndex) 
 

5.页面信息处理类(TreateHTML


6.网爬类

Crawl



7.创建Web内容索引类()

8.搜索Web内容类

结束!

Feedback

#1楼   回复  引用    

2006-12-01 10:20 by 强![未注册用户]
非常好!

#2楼   回复  引用  查看    

2006-12-01 10:32 by Sunlight      
很不错,但好像很难看懂

#3楼   回复  引用  查看    

2006-12-01 10:32 by Jason Cui      
不知道抓到网页以后,如果取它的标题和内容部分?

#4楼   回复  引用    

2006-12-01 10:40 by 信息谷[未注册用户]
放首页一次就够了,干吗要发了一条 又一条,还都放到首页
我看你是想让大家点你的 GoogleAD吧

#5楼[楼主]   回复  引用  查看    

2006-12-01 11:03 by xuanfeng      
@Jason Cui
请看TreateHTML类

@信息谷
我觉得用心写过的东西,就会放在首页与大家共亨自己想法并已在和大家交流,并非限定在我写了一篇还是N篇,并且我都以简要的方式发布,并不会占用首页很大的空间。

#6楼   回复  引用    

2006-12-01 11:31 by 信息谷[未注册用户]
那就把你的那个烂广告去掉!!!!
类关系图下一个广告
网爬类下还一个广告
还隐藏的这么好 生怕 别人点不到似的

#7楼   回复  引用  查看    

2006-12-01 12:05 by Eunge      
广告无可非议,每个人都有自己的自由,这是Weblog!

#8楼   回复  引用    

2006-12-01 13:58 by gozh2002
are you using lucene?
is there a good threading-pool support?

#9楼   回复  引用    

2006-12-01 14:43 by wav[未注册用户]
能否提供程序的下载?多些说明。

#10楼[楼主]   回复  引用  查看    

2006-12-01 16:11 by xuanfeng      
@gozh2002
No!I use lucene's .net edition!It is a excellent seacher framework!
@wav
请看主页的另一篇随笔!

#11楼   回复  引用  查看    

2006-12-01 21:53 by Wisdom-zh      
呵呵,这样做广告,有新意啊!!!
学习中。。。

#12楼   回复  引用  查看    

2007-01-21 11:56 by 海纳百川      
楼主写的不错学习中,最好能系统的写篇文章来供网友学习。



发表评论

昵称: [登录] [注册]

主页:

邮箱:(仅博主可见)

评论内容:

  登录  注册

[使用Ctrl+Enter键快速提交评论]

0 578620




相关文章:

相关链接: