2013年12月25日

Beta版本软件使用说明

摘要: 北京航空航天大学计算机学院 远航1617 小组产品版本: Beta版本产品名称:Crawling is going on文档作者:杨帆文档日期:2013/12/241. 引言1.1 编写目的 编写本使用说明的目的是充分叙述本软件所能实现的功能及其运行环境,以便使用者了解本软件的使用范围和使用方法,并为软件的维护和更新提供必要的信息。1.2 参考资料资料名称作者自己动手写网络爬虫罗刚Web数据挖掘(Soumen Chakrabarti)查凯莱巴蒂软件测试肖汉精通SQL Server 2008完全自学手册金玉明1.3 术语和缩写词缩略语全意爬虫一种自动获取网页内容的程序,是搜索引擎的重要组成... 阅读全文

posted @ 2013-12-25 02:11 远航1617 阅读(476) 评论(0) 推荐(0) 编辑

Beta版本发布说明

摘要: 项目名称Crawling is going on项目版本Beta版本负责人北京航空航天大学计算机学院 远航1617 小组联系方式http://www.cnblogs.com/yuanhang1617要求发布日期2013-12-24文档作者杨帆1 更新内容1.1 修复缺陷a) 异常处理功能已修复,对于客户端的异常具有容错能力。b) 广告过滤功能已优化,支持更广泛的爬取源网址。1.2 新增功能a) 可以选择源网址输入方式,一次性输入多个源网址。b) 界面进行了排版和优化。c) 支持网页上pdf文件的爬取。d) 新增分析功能,对数据库内爬取文件的类型和数量进行统计,以饼状图的形式展示。1 环境要求操 阅读全文

posted @ 2013-12-25 02:02 远航1617 阅读(239) 评论(0) 推荐(0) 编辑

导航