摘要: 极速动车网络采集器5.3主要更新1.增加简约日志功能,让日志显示的更加容易观看2.增加对大数据请求的支持。3.增强循环采集功能,增强了对论坛的支持。4.修复了模版配置的一些bug5.右键菜单增加查看结果的功能6.优化了部分界面的布局7.增强了队列稳定性和内存占用如有任何问题欢迎留言反馈http://home.cnblogs.com/group/topic/43982.html点击下载极速动车采集器5.3下载链接从新整理 阅读全文
posted @ 2011-04-17 18:41 wangzsky 阅读(2202) 评论(24) 推荐(0) 编辑
摘要: 1.上篇简要的说明了软件的使用,如需对软件详细的配置,在菜单 工具-系统全局配置里面2.这里先介绍字符引擎的规则说明 1.字符引擎里面的保留关键字为:“*” 和 “|” 2.在添加规则里面主要有:标题是你要采集的你要的内容的说明,如:你要的是网页标题你可以填写“标题”或者其他的你知道的意思。 3.返回类型:主要是你对这个内容的判断,目前支持3中,如果是循环采集一般是返回集合 4.步骤处理:主要是你定义的这么多规则,那些是在第一步处理,那些是第二次处理的,理论上可以无限设置下去 如:第一步我采集连接,返回集合步骤1,那么在更具返回的链接采集里面的内容那边设置规则后选择步骤2即可 5.解析引擎:和 阅读全文
posted @ 2011-03-30 10:50 wangzsky 阅读(539) 评论(0) 推荐(0) 编辑
摘要: 1.极速动车组采集器系统需求极速动车组采集器是绿色软件。如果您电脑上安装了微软的.NET FrameWork 2.0框架或更高版本,安装时直接解压缩到您电脑的任何地方即可完成采集器的安装--安装过程不操作注册表和系统文件,不产生任何垃圾文件!如果您安装后程序无法启动,那可能是您电脑没有安装.NET FrameWork 2.0,请下载微软的.NET FrameWork 2.0框架或更高版本并安装。附2.0下载地址:.net framework 2.0微软官方下载地址: http://download.microsoft.com/download/5/6/7/567758a3-759e-473e- 阅读全文
posted @ 2011-03-30 10:26 wangzsky 阅读(865) 评论(0) 推荐(0) 编辑
摘要: 极速动车网络采集器5.2发布更新主要功能1.导入和导出采用异步防止多个导入造成UI假死,进度提示更加贴心2.修复CPath和Nquery解析引擎一些bug3.免费版提供导出和Cpath引擎4.测试工具添加地址和规则历史记录,方便输入选择5.优化启动速度6.添加采集间隔时间,防止封IP7.添加完成后自动导出,实现采集-入库一体化。一键完成所有操作8.加入任务调度中心,方便循环任务和调度9.修复部分细节问题(11-1-16)下载地址http://files.cnblogs.com/wangzsky/%e6%9e%81%e9%80%9f%e5%8a%a8%e8%bd%a6%e7%bb%84%e9%8 阅读全文
posted @ 2011-01-15 13:53 wangzsky 阅读(1874) 评论(16) 推荐(0) 编辑
摘要: 极速动车组采集器5.1问题反馈处小组地址http://home.cnblogs.com/group/topic/43982.html或者直接回帖 阅读全文
posted @ 2011-01-12 10:01 wangzsky 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 1.做一个工具,用户只要输入页面地址,让后在导航出来的页面,上面画一下你想要的内容,会自动生成相应的规则2.目前有4个引擎,会生成4个规则,并且给出结果那个最快5.1下载地址http://www.cnblogs.com/wangzsky/archive/2010/12/31/1923266.htmlhttp://files.cnblogs.com/wangzsky/%e6%9e%81%e9%80%9f%e5%8a%a8%e8%bd%a6%e7%bb%84%e9%87%87%e9%9b%86%e5%99%a85.1.rar有兴趣的朋友可以沟通合作 阅读全文
posted @ 2011-01-04 08:37 wangzsky 阅读(543) 评论(0) 推荐(2) 编辑
摘要: 1.修复规则编辑Bug2.添加结果详细查看3.Cpath引擎和NQuery支持数字选择4.添加帮助界面5.添加Mode里2套采集模版和混合采集模版6.新增多项适用功能只有你知道字符概念,熟悉jquery的语法,你就会用动车组采集工具,快速的采集网页内容一个和jquery选择器语法相似的NQuery选择器满足你的要求7.优化启动速度(5.1优化版)http://files.cnblogs.com/wangzsky/%e6%9e%81%e9%80%9f%e5%8a%a8%e8%bd%a6%e7%bb%84%e9%87%87%e9%9b%86%e5%99%a85.1.rar 阅读全文
posted @ 2010-12-31 16:50 wangzsky 阅读(955) 评论(4) 推荐(1) 编辑
摘要: 极速动车组网络采集工具5.1更新功能1.添加新的解析引擎NQuery,语法和JQuery的选择器相似非常方便选择2.智能处理掉c#path引擎中没有跟路径的情况,支持多个复杂选择器(可以直接输入)3.添加批量代理服务器测试和代理连接性能查看,帮你快速的选择好的代理服务器4.添加采集结果查看详细信息5.加入起始页和帮助信息显示(可在系统配置里设置)6.优化结果替换规则,支持批量通配符替换7.调整老板键注册方式,系统设置改变后可以立即生效8.修复预览结果和任务Html错误提示9.优化图片下载方式10.优化队列逻辑代码,减少部分代码================================== 阅读全文
posted @ 2010-12-30 15:48 wangzsky 阅读(261) 评论(0) 推荐(0) 编辑
摘要: 1.快速入门1.下载软件,解压后运行WangzSoft.WebSpider5.exe2.点击软件菜单步骤如:帮助--测试项目3.这个时候在左边有一个3个测试任务4.点击任何一个任务选择:一键重新开始5.采集完成软件右下角有提示和播放完成的声音6.点击采集软件中结果菜单--查看结果。立刻可以查看采集的结果7.在结果菜单中可以导出到SQL,Excel,Access2.添加自定义任务1.添加一个工程2.在工程上右键点击添加任务3.在弹出的菜单中输入任务名称,添加采集网址库4.在网址库添加向导中输入批量或者单个网址如:http://news.qq.com/newsgn/zhxw/shizhengxi 阅读全文
posted @ 2010-12-23 16:38 wangzsky 阅读(463) 评论(1) 推荐(0) 编辑
摘要: 经过大半年的努力,极速动车组从无到有,最新的5.0版本终于做好了,在这里记录下自己的劳动成果!回想第一个版本,梦想jq一样的解析,重点放到解析上面去了。对于大数据量的考虑没有到位第二版版本从新考虑大数量队列在(100w左右)提升很多性能第三个版本重点支持多数据库,和优化大量队列和其他好的功能第四个版本重点支持多任务,调整任务队列编码,优化线程操作极速动车组网络采集在第五个版本添加插件功能,重新构架,运^_^行速度和稳定性都比以前完善,重要的调整了输入和任务备份,非常方便的操作。一站式采集#^_^#,整个程序解压后立刻(在.net2.0以上版本的机器上)运行我的极速动车组软件特点简单归纳:1.无 阅读全文
posted @ 2010-12-21 11:24 wangzsky 阅读(1475) 评论(0) 推荐(0) 编辑