JS charCodeAt在PHP中的等价物(完整的unicode和表情符号兼容性)

我在JS中有一个简单的代码,如果涉及特殊字符,我无法在PHP中复制。

这是JS代码(请参阅JSFiddle输出):

var str = "t🙏🏿😘🎚↙️🕗🇨🇬芳"; //char "t" and special characters, emojis, etc..
document.write("Length is: "+str.length); // Length is: 19
for(var i=0; i<str.length; i++) {
  document.write("<br> charCodeAt(" + i + "): " + str.charCodeAt(i));
}

第一个问题是PHP strlen()并且mb_strlen()已经给出了JS的不同结果(strlen:39,mb_strlen:11),但是我设法使用自定义JS_StringLength函数(由于这个 SO答案)。

这是我到目前为止在PHP中的内容(请参阅phpFiddle输出):

<?php

function JS_StringLength($string) {
    return strlen(iconv('UTF-8', 'UTF-16LE', $string)) / 2;
}

function JS_charCodeAt($str, $index){
    //not working!

    $char = mb_substr($str, $index, 1, 'UTF-8');
    if (mb_check_encoding($char, 'UTF-8'))
    {
        $ret = mb_convert_encoding($char, 'UTF-32BE', 'UTF-8');
        return hexdec(bin2hex($ret));
    } else {
        return null;
    }
}

$str = "t🙏🏿😘🎚↙️🕗🇨🇬芳";

echo $str."\n";
//echo "Length is: ".strlen($str)."\n"; //wrong
echo "Length is: ".JS_StringLength($str)."\n"; //OK
for($i=0; $i<JS_StringLength($str); $i++) {
    echo "charCodeAt(".$i."): ".JS_charCodeAt($str, $i)."\n";
}

 

经过一整天的谷歌搜索, 尝试  我发现的一切,没有任何东西给出与JS相同的结果。什么应该JS_charCodeAt是获得相同输出的JS有类似的表现

试验#1:将 我的字符串输入https://r12a.github.io/app-conversion/(很棒的东西)。看起来JS使用UTF-16代码单元(19)和PHP strlen计算UTF-8代码单元(39)。

试验#2: 当json_encode()我在我的字符串上使用时 - 当然 - 结果几乎就是这样,JavaScript可能会使用什么。我甚至检查了json_encode的原始PHP源代码以及json_encode如何转义字符串,但是......好吧..

 

 

 

转:  https://cloud.tencent.com/developer/ask/191240/answer/298870

参考 : http://www.w3school.com.cn/jsref/jsref_charCodeAt.asp

 

posted @ 2018-11-19 15:16  与f  阅读(689)  评论(0)    收藏  举报