UTF-8编码规则(转)
摘要:        
UTF-8是Unicode的一种实现方式,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是0X4E00到0x9FA5,是指unicode值,至于放在utf-8的编码里去就是由三个字节来组织,所以可以看出unicode是给出一个字符的范围,定义了这个字是码值是多少,至于具体的实现方式可以有多种多样来实现。UTF-8是一种变长字节编码方式。对于某一个字符的UTF-8编码,如果只有一个字节则其最高二进制位为0;如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的位数,其余各字节均以10开头。UTF-8最多可用到6个字节。如表:1字节 0xxxxxxx2字节 110    阅读全文
		
		posted @ 2011-08-11 10:09 奋斗者 阅读(89909) 评论(3) 推荐(24)
 
                    
                     
                    
                 
                    
                 浙公网安备 33010602011771号
浙公网安备 33010602011771号 
