摘要:
在碰到这个问题之前,我对UTF-8的理解只停留在一种unicode编码的认识上。在超出字符集编码区间的范围外的字符,转化成Utf-8编码时会在文件头中加上标识,以便解析器能够准确识别文件的编码,如果去掉以后将会导致编码异常。。UTF-8以字节为编码单元,没有字节序的问题。UTF-16以两个字节为编码单元,在解释一个UTF-16文本前,首先要弄清楚每个编码单元的字节序。例如收到一个“奎”的Unicode编码是594E,“乙”的Unicode编码是4E59。如果我们收到UTF-16字节流“594E”,那么这是“奎”还是“乙”?Unicode规范中推荐的标记字节顺序的方法是BOM。BOM不是“Bil 阅读全文
posted @ 2013-07-01 19:05
爵爷Jarvis
阅读(1016)
评论(0)
推荐(0)

浙公网安备 33010602011771号