摘要: 每一个二进制位(bit)有0和1两种状态,八个二进制位被称为一个字节(byte);因此一个字节可以组合出256个状态,即对应256个字符;ASCII:ASCII码一共规定了128个字符的编码;只占用了一个字节的后面7位,最前面的1位统一规定为0;GB2312:GB2312对ASCII简体字扩展;两个字节表示一个汉字,可以表示256x256=65536个符号。后更新出gbk,gb18030,即gb系列;big5:big5对ASCII繁体字扩展;Unicode:Unicode是一个很大的集合,现在的规模可以容纳100多万个符号,达到4个字节;太过庞大这对于存储来说是极大的浪费,文本文件的大小会因此 阅读全文
posted @ 2011-09-04 23:19 chesihui 阅读(287) 评论(0) 推荐(0) 编辑