Python 字符串格式化

转载请注明出处

Python2.6+ 增加了str.format函数，用来代替原有的'%'操作符。它使用比'%'更加直观、灵活。下面详细介绍一下它的使用方法。

下面是使用'%'的例子:

""
"PI is %f..." % 3.14159 # => 'PI is 3.141590...'
"%d + %d = %d" % (5, 6, 5+6) # => '5 + 6 = 11'
"The usage of %(language)s" % {"language": "python"} # => 'The usage of python'

格式很像C语言的printf是不是？由于'%'是一个操作符，只能在左右两边各放一个参数，因此右边多个值需要用元组或者字典来包括，不能元组字典一起用，缺乏灵活度。
同样的例子用format方法改写:

"PI is {0}...".format(3.14159) # => 'PI is 3.14159...'
"{0} + {1} = {2}".format(5, 6, 5+6) # => '5 + 6 = 11'
"The usage of {language}".format(language = "Python") # => 'The usage of Python'

是不是很直观？（当然，使用C语言的我也很喜欢前一种格式表达方式 😃 ）

格式化字符串

"{named} consist of intermingled character {0} and {1}".format("data", "markup", \
    named = "Formats trings")
format(10.0, "7.3g") # => '     10'
"My name is {0} :-{{}}".format('Fred') # => 'My name is Fred :-{}'

注意第一行的''，如果一个语句要换行，必须在结尾加上反斜线转义。
用'%'无法像这样将元组和字典混用。其实这里是命名参数，Python的一个特性。可以在定义数组的时候用*args, **kwargs语法展开集合和字典。需要注意，命名参数放在后面。
第二个语句表示format内置函数用来格式化单个值。
第三个语句表示了{}的转义，因为{}在被格式化字符串里是特殊字符，不能直接显示。转义方式是多嵌套一层。

使用属性和索引

"My name is {0.name}".format(open('out.txt', 'w')) # => 'My name is out.txt'

'{0.name}' 相当于调用对象的属性 open('out.txt', 'w').name

"My name is {0[name]}".format(dict(name='Fred')) # => 'My name is Fred'

使用索引也是可以的。
obj[key] 相当于 obj.getitem('key')

标准说明符（Specifiers）

写过C语言的程序员应该清楚printf的复杂。format也定义了很多标准的说明符，用来解释一个值的格式，然后插入字符串内。例如：

"My name is {0:8}".format('Fred') # => 'My name is Fred    '

':'之后便是说明符了，上面例子中说明符只有一个'8'(minimumwidth)，它表示插入的值宽度至少为8。'Fred'只有4，所以又加了4个空格。

说明符的详细格式为：
[[fill]align][sign][#][0][minimumwidth][.precision][type]
（不比C的printf更简洁啊!）
注意：'[]'表示该元素可选。所以，所有的格式说明符都是可选的！就像之前的例子，几乎都没有用这个（只是为了例子更清晰）。实际上，这些是很有用的。

我们一个个来看：

[fill]align 表示排列方式。当minimumwidth设置的比插入的值大时，就有了留白，就像上一个例子中的'My name is Fred '。默认把留白放在了右边，也就是说插入值默认是左对齐的。如果我们试试{0:>8}，会发现结果变成了'My name is Fred'。
fill 表示用来填充留白的字符。只有在align指定了的情况下fill才有用！ align可以是下面的标识：
- < 左对齐，默认
- > 右对齐
- = 将留白放在align标识后面，只对数字有效。什么意思呢？align下面会讲到，显示数字的正负号，同样只对数字有效。如果指定了'='，那么就会把数字的正负号显示在留白的前面。例如：format(-12, "0=8") # => '-0000012' 注意这里用的是格式化单个值的内置函数format。'0'是fill元素，用它来填充留白；'='就是该标识了；'8'是指最小宽度为8，因此才有5个留白。那么align呢？align其实就是说明正负号的显示方式，这里使用默认的'-'，之后会讲到。
- ^ 居中对齐
sign 数字符号，只对数字有效。
- + 显示加号和减号
- - 不显示加号，显示减号。在不指定最小宽度的情况下负数总是比正数多占一个符号位置。默认
- ' ' (一个空格) 用一个留白代替加号
# 显示数字的前缀表示几进制（0b, 0o, 0x）
0 用'0'填充留白。
minimumwidth 指定最小宽度，已经用过很多次了。
.precision 'precision'是一个十进制数字，表示显示小数点后几位。
type 值的类型：
- 整型：
  - b 二进制
  - c 字符型，把数字转成表示unicode的字符
  - d 十进制
  - o 八进制
  - x 十六进制，显示小写字母
  - X 十六进制，显示大写字母
  - n 与d行为相同，使用本地的数字表示方式
  - ''(空，没有空格) 与d相同
- 浮点数
  - e 科学计数法表示，小写e
  - E 科学计数法表示，大写E
  - f 显示为定点数，默认小数点后六位
  - F 同f
  - g 自动选择是否用科学记数法表示
  - G 同g
  - n 同g，使用本地表示方式
  - % 使用百分比表示
  - ''(空) 同g

每个对象可以重写自己的格式化说明符，例如datatime类重写了后可以这样表示：

"Today is: {0:%a %b %d %H:%M:%S %Y}".format(datetime.now())

预先转换

':'之后是格式说明符，之前还可以加预先转换的标识

!r 调用对象的____repr____方法来转换成标准字符串
!s 调用对象的____str____方法来转换成字符串

重写format方法

我们在格式化一个字符串时，首先格式化每个值，然后再插入字符串内。格式化值调用的就是format内置方法。format则是简单地调用该值的____format____方法。

def format(value, format_spec):
    return value.__format__(format_spec)

在object类内实现了____format____方法，只是将本身用str()转换成字符串，然后将字符串传入内置的format方法，实际上就是调用转换为字符串后的____format____方法。

class object:
    def __format__(self, format_spec):
        return format(str(self), format_spec)

int/float/str自身实现了____format____方法，前面已经介绍了它们各自的说明符。

结束语

还有一点儿是自定义Formatter，不过平常也用不到。留作下篇string模块源码解读的内容吧。建议有兴趣的朋友多看看Python标准库的源码，很有学习价值。

参考：https://www.python.org/dev/peps/pep-3101/

posted @ 2017-02-19 23:07 新月的力量_141 阅读(1936) 评论(0) 收藏举报

刷新页面返回顶部

新月的力量