2018年8月14日

常用模块三

摘要: re 正则表达式,内部实现不是python而是C语言:带有特殊含义的符号或者符号组合,作用是按照规则对字符串进行过滤 贪婪匹配 *,+不是固定的特殊符号。而是一种现象,会一直匹配到不满足条件为止,用?来阻止贪婪匹配,匹配最少满足条件的字符数:用()给正则表达式分组group,不会改变原来表达式逻辑意 阅读全文

posted @ 2018-08-14 14:23 吃粥哈哈哈哈 阅读(67) 评论(0) 推荐(0)

字符编码与文件处理

摘要: 字符编码 ascll:八位bit二进制数表示一个字符;8bit=1Bytes GBK:用2Bytes对应一位中文字符,用1Bytes对应一个英文字符 Unicode:用2Bytes对应一个字符;兼容万国字符,与老的字符编码都有一种数字之间的对应关系 utf-8:Unicode transformat 阅读全文

posted @ 2018-08-14 13:57 吃粥哈哈哈哈 阅读(60) 评论(0) 推荐(0)

导航