关于php使用xpath解析html中文乱码问题

1 $str2 = '<div id="content">我很好   </div>';     
2  $dom = new DOMDocument();
3  //load之前强转字符编码
4 $str2 = mb_convert_encoding($str2 ,'HTML-ENTITIES',"UTF-8");
5 $dom->loadHTML($str2);
6 $xpath = new DOMXPath($dom);
7 $element = $xpath->query("//div[@id='content']")->item(0)->nodeValue;
8  var_dump($element);

在处理html时,除了可以用正则外,可以考虑使用dom来解析。解决中文乱码就是在load文件之前,转换编码。

posted @ 2018-05-10 16:22  zhou_blog  阅读(729)  评论(0编辑  收藏  举报