策码兄弟
摘要: 一直以来使用php解析html文档树都是一个难题。Simple HTML DOM parser 帮我们很好地解决了这个问题。可以通过这个php类来解析html文档,对其中的html元素进行操作 (PHP5+以上版本)。解析器不仅仅只是帮助我们验证html文档;更能解析不符合W3C标准的html文档。它使用了类似jQuery的元素选择器,通过元素的id,class,tag等等来查找定位;同时还提供添加、删除、修改文档树的功能。当然,这样一款强大的html Dom解析器也不是尽善尽美;在使用的过程中需要十分小心内存消耗的情况。不过,不要担心;本文中,笔者在最后会为各位介绍如何避免消耗过多的内存。开 阅读全文
posted @ 2013-12-17 13:42 策码秀才 阅读(385) 评论(0) 推荐(0)
摘要: 有些网站直接用file_get_contents就能采集, 但是有些不行。 于是可以在网址前加入 'compress.zlib://‘ $url = 'compress.zlib://' . 'http://shihuwansm.soufun.com/house/1823108428/housede 阅读全文
posted @ 2013-12-17 11:17 策码秀才 阅读(346) 评论(0) 推荐(0)
策码兄弟