随笔分类 -  [04] [Java]-网页数据采集器

基于Java 和 MySql的网页数据采集器开发
摘要:上期我们学习了html页面采集后的数据查询, 但这仅仅是在本地查询数据库,如果我们想通过远程操作来进行数据的采集,存储和查询,那又该怎么做呢? 今天我们一起来学习下:如何通过本地客户端远程访问服务端来进行数据的采集,存储和查询. 阅读全文
posted @ 2012-01-22 04:03 SilverSky(Jason) 阅读(7227) 评论(4) 推荐(7) 编辑
摘要:上一期我们学习了如何将html采集到的数据存储到MySql数据库中,这期我们来学习下如何在存储的数据中查询我们实际想看到的数据. 阅读全文
posted @ 2012-01-21 05:08 SilverSky(Jason) 阅读(6041) 评论(11) 推荐(5) 编辑
摘要:上期我们学习了html页面的数据采集,为了方便我们今后来调用收集到的数据,首先我们需要学习下如何将这些采集到的数据存储起来(MySql数据库). 阅读全文
posted @ 2012-01-03 00:32 SilverSky(Jason) 阅读(8095) 评论(10) 推荐(5) 编辑
摘要:作为全球运用最广泛的语言,Java 凭借它的高效性,可移植性(跨平台),代码的健壮性以及强大的可扩展性,深受广大应用程序开发者的喜爱. 作为一门强大的开发语言,正则表达式在其中的应用当然是必不可少的,而且正则表达式的掌握能力也是那些高级程序员的开发功底之体现,做一名合格的网站开发的程序员(尤其是做前端开发),正则表达式是必备的. 本期概述: 这期我们来学习下如何读取网页源代码,并通过group正则 动态抓取我们需要的网页数据.同时在接下来的几期,我们将继续学习[数据存储]如何将抓取的比赛数据存到数据库(MySql), [数据查询] 怎样查询我们想看的比赛记录,以及[远程操作]通过客户端远程访问和操作服务器来进行数据的采集,存储和查询. 阅读全文
posted @ 2011-12-24 10:31 SilverSky(Jason) 阅读(31381) 评论(46) 推荐(7) 编辑