摘要:
1.获取html 方案:curl即可,有很多类的,百度一下。注意:现在很多网站(新浪微博等)主要类容都延迟加载,ajax加载,这样curl搞不到啊,现在还没找到解决方案,据说搞定这个问题可以赚500万。2.解析html_dom方案:用simple_html_dox类教程:一直以来使用php解析html文档树都是一个难题。Simple HTML DOM parser帮我们很好地解决了这个问题。可以通过这个php类来解析html文档,对其中的html元素进行操作 (PHP5+以上版本)。解析器不仅仅只是帮助我们验证html文档;更能解析不符合W3C标准的html文档。它使用了类似jQuery的元素 阅读全文
posted @ 2012-12-19 20:41
lorry01
阅读(281)
评论(1)
推荐(1)