编码介绍

1   ==比较的是数据
    is比较的是内存地址比较
2编码:不同编码之间的二进制是不能互相识别的,文件传输和存储不能用unicode,内存占用太大
    ascii:数字,字母,特殊字符
        字节:8位代表一个字符
        字符:是内容的最小组成单位
            abc:a代表一个字符
            中国:中代表一个字符
    unicode:万国码
        四个字节代表一个字符
    utf-8
        最少用8位标识一个字符
        a:8个字节
        中:24个字节
    数据类型;int bool str list dict tuple bytes
        str:编码默认为unicode
        bytes:编码非unicode,在内存编码看不懂
        str文件存储传输必需先转换为bytes
        编码方式必需和解码方式一致
        str转换bytes用encode编码
        bytes转换str转换用decode解码
            s1 = "中国"
            b1 = s1.encode("utf-8")
            print(b1)  # b'\xe4\xb8\xad\xe5\x9b\xbd'
            b2 = b1.decode("utf-8")
            print(b2)  # 中国

 

 

posted @ 2021-09-23 16:40  杨先生`  阅读(217)  评论(0)    收藏  举报