摘要: (1)EventSinks--接收Events(2)Rules(3)Resources 阅读全文
posted @ 2005-10-07 17:08 xiaotie 阅读(1312) 评论(0) 推荐(0)
摘要: (1)Tasks--引擎调度,网页解析应该都是通过Tasks实现的(2)CoreEvents 与 CoreEvents' Visitor--一些核心Event和一个Agent(3)JSpiderEvents 与 JSpiderEvents' visitors--扩展JSpider最需要了解这一块。JSpider提供了3种Visitor,对于特定的应用,需要扩展现有Visitor或者实现自己的Vis... 阅读全文
posted @ 2005-10-07 16:27 xiaotie 阅读(1434) 评论(0) 推荐(0)
摘要: (本系列文章主要是阅读笔记,描述偶的阅读过程,看起来可能比较杂乱,缺乏逻辑性--等偶把JSpider弄明白后会出修改版的。:P JSpider有数万行代码,又没有开发手册,只能瞎子摸象般的看了)JSpider用户手册里面有这样一张结构图:结合代码,可以看出JSpider大概组成如下:(1)JSpider的核心:装载插件,获取配置信息,初始化调度器。机制比较复杂,具体的代码没细看。(2)Dispa... 阅读全文
posted @ 2005-10-07 16:13 xiaotie 阅读(2144) 评论(0) 推荐(0)
摘要: 从名字可以看出,JSpider是一个用Java实现的Web Spider。JSpider官方网站这样说的: JSpider is: • A highly configurable and customizable Web Spider engine. • Developed under the LGPL Open Source license • In 100% pure Jav... 阅读全文
posted @ 2005-10-07 15:55 xiaotie 阅读(3389) 评论(0) 推荐(0)
摘要: 运行: 1,下载jspider-0.5.0-dev.zip,解压缩. 2,开始->运行->cmd,进入命令行窗口,进入jspider-0.5.0-dev/bin目录 3, 试着抓取网站http: //j-spider.sourceforge.net的内容: jspider http: //j-spider.sourceforge.net >> out.txt 可以看见屏幕上显示: J... 阅读全文
posted @ 2005-10-07 15:28 xiaotie 阅读(7470) 评论(2) 推荐(1)