JeffSunpan27

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

一、字符编码

ASCII,主要用于现代英语,定长1byte,最多表示2^8-1=255个符号

GB2312,约7k个汉字,数量太少
GBK扩展到了2w汉字,还有藏文,蒙古文,维吾尔文等
GB18030再GBK基础上扩展到了2.7w字符

ASCII,GB2312,GBK,GB18030是向下兼容的,并且GB编码定长2byte

UTF-8,变长编码,1byte ASCII,2byte 欧文,3byte 中文

python2默认使用ASCII,有中文需要指定编码格式

二、数据类型

int,32位占用4字节
long,理论可以无限大,数据过大时会自动转换为long,python3不会转换,全部为int
float,64位占8字节
bool,1或者0,true或者flase
string,"aabbxx"

python中字符串的常用功能:移除空白,分割,长度,索引,切片,格式化输出
举例:

posted on 2017-12-24 21:45  JeffSunpan27  阅读(353)  评论(0编辑  收藏  举报