一、字符编码
ASCII,主要用于现代英语,定长1byte,最多表示2^8-1=255个符号
GB2312,约7k个汉字,数量太少
GBK扩展到了2w汉字,还有藏文,蒙古文,维吾尔文等
GB18030再GBK基础上扩展到了2.7w字符
ASCII,GB2312,GBK,GB18030是向下兼容的,并且GB编码定长2byte
UTF-8,变长编码,1byte ASCII,2byte 欧文,3byte 中文
python2默认使用ASCII,有中文需要指定编码格式
二、数据类型
int,32位占用4字节
long,理论可以无限大,数据过大时会自动转换为long,python3不会转换,全部为int
float,64位占8字节
bool,1或者0,true或者flase
string,"aabbxx"
python中字符串的常用功能:移除空白,分割,长度,索引,切片,格式化输出
举例: