摘要: 在上篇基于PHP采集数据入库程序(一)中提到采集新闻信息页的列表数据,接下来讲讲关于采集新闻具体内容这是上篇博客的最终数据表截图:接下来要做的操作就是从数据库中读取所需要采集的URL,进行页面抓取就行新建一个content表不过需要注意的一点是,不能再采用采集URL这种id递增的方法去采集,因为数据... 阅读全文
posted @ 2014-07-28 15:55 李晨玮 阅读(3420) 评论(4) 推荐(0) 编辑
摘要: 前几天有一朋友要我帮做一个采集新闻信息的程序,抽了点时间写了个PHP版本的,随笔记录下。说到采集,无非就是远程获取信息->提取所需内容->分类存储->读取->展示也算是简单"小偷程序"的加强版吧下面是对应核心代码(别拿去做坏事哦^_^)所要采集的内容是某游戏网站上的公告,如下图:可先利用file_g... 阅读全文
posted @ 2014-07-28 13:46 李晨玮 阅读(7287) 评论(6) 推荐(3) 编辑