bug_x

导航

 

原因是phpQuery认不清目标网页是什么编码,即找不到meta属性的时候,会默认转换成iso-8859-1的格式。

所以乱码么,需要先从iso-8859-1的格式转换成utf-8的格式,再转换成GBK的格式。

就能得到满意的结果了。

如下:

$t = pq('h1#h1title')->text();
$t = mb_convert_encoding($t,'ISO-8859-1','utf-8');
$t = mb_convert_encoding($t,'utf-8','GBK');
echo $t;

但是具体原因还不是很清楚,回头补上..

posted on 2016-10-09 17:32  bug_x  阅读(356)  评论(0)    收藏  举报