摘要:
这个解析器只是作为个人爱好去研究,陆陆续续的投入精力,持续了很长时间,这期间发生了很多的事情。我在上海落脚很长时间后才又继续开发,并把项目命名为Wittiness。 项目的目的:构建一个Web信息挖掘机,能够高效方便的从网页中截取到需要的信息。 构建思路是:解析HTML标记 --> 构建层次对象 --> 查询获取承载了需要信息的对象 --> 按对象层次输出结果 其中难度比较大的就... 阅读全文
posted @ 2006-03-06 13:39
format
阅读(5115)
评论(17)
推荐(0)

浙公网安备 33010602011771号