2008年9月11日

如何构造一个C#语言的爬虫蜘蛛程序

摘要: C#特别适合于构造蜘蛛程序,这是因为它已经内置了HTTP访问和多线程的能力,而这两种能力对于蜘蛛程序来说都是非常关键的。下面是构造一个蜘蛛程序要解决的关键问题:   ⑴ HTML分析:需要某种HTML解析器来分析蜘蛛程序遇到的每一个页面。   ⑵ 页面处理:需要处理每一个下载得到的页面。下载得到的内容可能要保存到磁盘,或者进一步分析处理。   ⑶ 多线程:只有拥有多线程能力,蜘蛛程序才能真正做到高效。   ⑷ 确定何时完成:不要小看这个问题,确定任务是否已经完成并不简单,尤其是在多线程环境下。 阅读全文

posted @ 2008-09-11 15:17 9who 阅读(2137) 评论(5) 编辑

导航

<2008年9月>
31123456
78910111213
14151617181920
21222324252627
2829301234
567891011

公告


欢迎光临 9who的博客!本博客文章适合初学者,其中有部分ASP.NET内容转载了网上比较经典文章,如有侵权请联系本人!
昵称:9who
园龄:4年7个月
粉丝:10
关注:0

搜索

 
 

常用链接

随笔分类

随笔档案

相册

博客园链接

资源站链接

积分与排名

  • 积分 - 187713
  • 排名 - 454

最新评论

阅读排行榜

评论排行榜