忙了一个月,终于把新闻采集系统做好了,最近前台工作也完成了,这几天开始测试,现放首页几天,欢迎大家提建议, 地址是:http://bbs.colorful.cn/。过几天我把采集模块部分整理一下跟大家分享,其主要思想是用多线程把各大网站的页面内容下载下来,在用正则表达式分析其内容,获取指定的内容并且下载相关的资源(包括链接和图片等资源)
posted on 2006-05-18 09:19  blockhead  阅读(2229)  评论(24编辑  收藏  举报