php函数substr、mb_substr、mb_strcut截取中文比较

一、函数说明
    substr、mb_substr、mb_strcut这三个函数都用来截取字符串,所不同的是:substr是最简单的截取,无法适应中文;mb_substr是按字来切分字符串,而mb_strcut是按字节来切分字符串,截取中文都不会产生半个字符的现象。
    这三个函数的前三个参数完全一致,即:
第一个参数是操作对象
第二个参数是截取的起始位置
第三个参数是截取的数量
    mb_substr和mb_strcut还有第四个参数:第四个参数可以根据不同的字符集进行设置

二、不同编码情况下截取中文比较
例一,建立以下文件(此文件的编码方式为gb2312):

 1 <?php
 2 //header("Content-type: text/css; charset=gb2312");//初次加载乱码可以打开这个
 3 echo $var = '55nav技术导航者';
 4 echo "<hr>";
 5 echo substr($var,  6 , 3);//打印乱码
 6 echo "<hr>";
 7 echo mb_substr($var,  6 , 3,"gb2312");//有最后一个参数打印:“术导航”。没有最后一个参数打印乱码
 8 echo "<hr>";
 9 echo mb_strcut($var,  6 , 3,"gb2312");//有没有最后一个参数都打印:“技”。
10 ?>

 

例二,建立以下文件(此文件的编码方式为UTF-8):

 1 <?php
 2 //header("Content-type: text/css; charset=UTF-8");//初次加载乱码可以打开这个
 3 echo $var = '55nav技术导航者';
 4 echo "<hr>";
 5 echo substr($var,  6 , 3);//打印乱码
 6 echo "<hr>";
 7 echo mb_substr($var,  6 , 3,"UTF-8");//有最后一个参数打印:“术导航”。没有最后一个参数打印乱码
 8 echo "<hr>";
 9 echo mb_strcut($var,  6 , 3,"UTF-8");//有最后一个参数打印:“技”。没有最后一个参数打印乱码
10 ?>

 

三、结论
        在不同编码环境中,substr、mb_strcut表现都不够理想,mb_substr可以正常使用,但前提是要安装php扩展库,否则就要自己写一个适应各种情况的截取函数了。

posted @ 2012-08-03 13:18  人生工程师  阅读(485)  评论(0编辑  收藏  举报