python自学笔记(二)python基本数据类型之字符串处理

一、数据类型的组成分3部分:身份、类型、值

身份:id方法来看它的唯一标识符,内存地址靠这个查看

类型:type方法查看

值:数据项

二、常用基本数据类型

int 整型

boolean 布尔型

string 字符串

list 列表

tuple 元组

dict 字典

三、数据类型的可变和不可变

不可变类型:int,string,tuple

可变类型:list,dict

 

python基本数据类型讲解

一、len 之需注意

例如:字符串"asd234"

默认的文件编码都是ascii码

unicode编码能描述全世界大部分语言,它只是一套标准,各国家的存储方式不一致

utf8是一种unicode编码的实现标准,这期间万维网的出现,正好需要一套标准来统一,utf8能根据各国操作系统的语言不同,选择对应的unicode编码

a = "哈" 默认是ascii编码  3个字节

a = u"哈" 用前面带u 这中方式转成unicode编码 或者 b = a.decode('uft-8') 解码,两种方式打印出的len 就是一个字节了。

二、转义符让文本更好处理

a = "ad\n\r" 换行回车

三、字符串前面的小尾巴作用

a = r"abc\n" 不转义  输出 ab\n

四、访问子字符串,序列来了(查找字符串)

a = "abcde"

print a[0] -->a

print a[len(a) - 1] 或 a[-1] 表示最后一个元素

a[0:] 从0位到最后 abcde

a[0:1] 大于等于左边的,小于右边的,就是大于等于第0位置,小于第一位,那就只剩下是 第0位元素了 就是输出 a

a[1:3] 输出 bc

a[4:3] 大于等于第4位,小于第3位,也就是从后往前查找,也就是输出 e

a[:-1] 默认从第0位开始,可以省略0 不写,小于最后一位(不包括最后一位)  输出 abcd

五、字符串拼接

1、超级丑陋的(不推荐)

a = 'ab'

b = 'cd'

c = a + b  输出 abcd

2、可选方案支字符串模板(占位符)

例如输出  "my name is niuniu"

print ("my name is %s" % "niuniu")  %s 是字符串占位符 %d是数字占位符

print ("my name is %s %s" % ("niuniu","zhenshuai"))  元组方式

3、推荐拼接的方案

a = "a"

b = "bcd"

c = "ef"

"".join([a,b,c]) 里面是list(数组) -->"abcdef"

 ",".join([a,b,c])-->"a,bcd,ef" 也可以用其他字符分割

 

六、字符串修改和查询 replace、find

a.replace("旧","新")  替换

a.find("world") 返回下标,-1为没找到

a.rfind()从右向左查找

a.index("world")返回下标,没找到会报错

a.count(",")查找有个数

 

七、formart格式化(%s %d的格式化不容易管理,位置不能变

用法1

b = "this {1}{0}".format("apple","my")

print b --> this is my apple

 

用法2

b = "this is{whose}{fruit}".format(fruit = "apple", whose = "my")

print b --> this is my apple

 

用法3 用字典来完善 %s %d的格式化

b = "this is %(whose)s %(fruit)s" %{"whose":"my","fruit":"apple"}

print b --> this is my apple

 

ps:help("str") 命令行方法,可查找所有系统封装的字符串函数方法

 

posted @ 2015-12-10 15:43  臻牛  阅读(361)  评论(0编辑  收藏  举报