摘要: 今天被安排做一下搜狐首页新闻部分抓取。本来很简单的事情,谁知到了搜狐页面抓过来的一直是乱码,怎么转都不行。只好深入研究了一下,也学到不少东西,写下来分享一下。一、什么是php采集程序?二、为什么要采集?三、采集些什么?四、如何采集?五、采集思路六、采集范例程序七、采集心得什么是php采集程序? php采集程序,也叫php小偷,主要是用于自动搜集网络上web页里特定内容,用php语言写的web程序,运行于支持php的平台上。谈到“自动搜集”,你可能联想到百度goole,联想到搜索引擎所做的事情。php采集程序,正是做类似的工作。为什么要采集?互联网正以飞快的速度在发展,web数据每天以几何级数据 阅读全文
posted @ 2012-11-09 22:56 风之相随 阅读(226) 评论(0) 推荐(0) 编辑