字符编码发展史

字符编码发展史

字符编码

计算机内部存储是以二进制数字的形式存储的
单位换算
     比特位bit(二进制的个数)
     8bit = 1byts(字节)
     1024bytes = 1KB
     1024KB = 1MB
     1024MB = 1GB
     1024GB = 1TB
     ...
字符编码表
   规定人类的字符与数字之间的对应关系
    
>>> res = '驱蚊器问问去夫七五'
>>> res.encode('gbk')
b'\xc7\xfd\xce\xc3\xc6\xf7\xce\xca\xce\xca\xc8\xa5\xb7\xf2\xc6\xdf\xce\xe5'

字符编码发展史

'''
文本文件统一编码用utf8
'''

字符编码实操

1:核心
    什么存什么取
2:编码与解码
    编码:
        将人类的字符按照指定的编码转换成计算机能识别的数据
        encode()
    解码:
        将计算机能识别的字符转换成人类能够读懂的字符
        decode()
  
 >>> res = '驱蚊器问问去夫七五'
>>> res.encode('gbk')
b'\xc7\xfd\xce\xc3\xc6\xf7\xce\xca\xce\xca\xc8\xa5\xb7\xf2\xc6\xdf\xce\xe5'
>>> res = b'\xc7\xfd\xce\xc3\xc6\xf7\xce\xca\xce\xca\xc8\xa5\xb7\xf2\xc6\xdf\xce\xe5'
>>> res.decode('gbk')
'驱蚊器问问去夫七五'
'''
上述这种类型:字节型,bytes
'''

3:python解释器默认编码
    python2默认的编码是ASCII码
        在python2中定义字符串在前面加一个字母 u
        文件头指定编码
             # -*- conding:utf8 -*-
            >>> name = u'lyh'
            >>> name
            u'lyh'
    python3默认的是 utf8
posted @ 2021-06-04 15:07  剧终cur  阅读(91)  评论(0)    收藏  举报