2013 年 7月 1 日随笔档案 - 爵爷Jarvis

2013年7月1日

摘要：在碰到这个问题之前，我对UTF-8的理解只停留在一种unicode编码的认识上。在超出字符集编码区间的范围外的字符，转化成Utf-8编码时会在文件头中加上标识，以便解析器能够准确识别文件的编码，如果去掉以后将会导致编码异常。。UTF-8以字节为编码单元，没有字节序的问题。UTF-16以两个字节为编码单元，在解释一个UTF-16文本前，首先要弄清楚每个编码单元的字节序。例如收到一个“奎”的Unicode编码是594E，“乙”的Unicode编码是4E59。如果我们收到UTF-16字节流“594E”，那么这是“奎”还是“乙”？Unicode规范中推荐的标记字节顺序的方法是BOM。BOM不是“Bil 阅读全文

posted @ 2013-07-01 19:05 爵爷Jarvis 阅读(1016) 评论(0) 推荐(0)

爵爷Jarvis

公告