关于python的一些笔记

　　Python源文件默认以UTF-8编码。在这种编码下，世界上大多数语言的字符可以在字符串，标识符和注释中同时使用 — 尽管标准库中的标识符只使用ASCII字符，它是可移植代码应该遵循的一个惯例。为了能够正确显示所有的这些字符，你的编辑器必须能够识别文件是UTF-8编码，且必须使用支持文件中所有字符的字体。

　　当然，也可以给源文件指定一个不同的编码。方法是在 #! 行的后面再增加一行特殊的注释来定义源文件的编码：

# -*- coding: encoding -*-

　　如果你只打印range，会出现奇怪的结果：

>>> print(range(10))
range(0, 10)

　　range()返回的对象的行为在很多方面很像一个列表，但实际上它并不是列表。当你迭代它的时候它会依次返回期望序列的元素，但是它不会真正产生一个列表，因此可以节省空间。

　　我们把这样的对象称为可迭代的，也就是说，它们适合作为期望连续获得元素直到穷尽的函数和构造器的目标。我们已经看到for语句是这样的一个迭代器。list()函数是另外一个；它从可迭代对象创建列表。可以想象，list()函数迫使可迭代对象将所有元素一次性生成为list型。

>>> list(range(5))
[0, 1, 2, 3, 4]

　　循环语句while/for可以有一个 else 子句；当循环是因为迭代完整个列表( for 语句)或者循环条件不成立（while 语句）终止，即正常终止，而非由break 语句终止时，else子句将被执行。下面循环搜索质数的代码例示了这一点：

 1 >>> for n in range(2, 10):
 2 ...     for x in range(2, n):
 3 ...         if n % x == 0:
 4 ...             print(n, 'equals', x, '*', n//x)
 5 ...             break
 6 ...     else:
 7 ...         # loop fell through without finding a factor
 8 ...         print(n, 'is a prime number')
 9 ...
10 2 is a prime number
11 3 is a prime number
12 4 equals 2 * 2
13 5 is a prime number
14 6 equals 2 * 3
15 7 is a prime number
16 8 equals 2 * 4
17 9 equals 3 * 3

　　是的，这是正确的代码。看仔细：else子句属于for 循环，不属于 if 语句。

　　函数体的第一行可以是一个可选的字符串文本，此字符串是该函数的文档字符串，或称为docstring。有工具能使用 docstrings 自动生成文档（如在线文档等），以方便查阅。以下是两种常见的写法：

1 >>> def fib(n):    # write Fibonacci series up to n
2 ...     """Print a Fibonacci series up to n."""
3 ...     a, b = 0, 1
4 ...     while a < n:
5 ...         print(a, end=' ')
6 ...         a, b = b, a+b
7 ...     print()

　　如果在文档字符串中有更多的行，第二行应该是空白，余下的行应该是一段或多段描述对象的调用约定、其副作用等。若docstring是多行的，则该串不会被自动去除行缩进，所以必要时文档字符串处理工具应自己作清除缩进工作。以下是一种“约定”，用函数体首行之后的第一个非空行字符串确定整个串的缩进的量（注：首行的缩进并不适合使用，因为它通常紧靠着字符串起始的引号，缩进格式不清晰）。剩下其他行的行首等于缩进量的空格都将被过滤掉。当然，这仅是一种约定。

 1 >>> def my_function():
 2 ...     """Do nothing, but document it.
 3 ...
 4 ...     No, really, it doesn't do anything.
 5 ...     """
 6 ...     pass
 7 ...
 8 >>> print(my_function.__doc__)
 9 Do nothing, but document it.
10 
11     No, really, it doesn't do anything.

　　函数的执行会引入一个新的符号表，用于函数的局部变量。更确切地说，函数中的所有的赋值都是将值存储在局部符号表；而变量引用首先查找局部符号表，然后是上层函数的局部符号表，然后是全局符号表，最后是内置名字表。因此，在函数内部全局变量不能直接赋值（除非用 global 语句命名），虽然可以引用它们。换句话说，在函数内所做的赋值操作仅在该函数内有效，而函数外的变量仍然不变。

1 a=10086
2 def change():
3     a=10010
4     return a
5 print(change())    --打印10010
6 print(a)        --打印10086

　　注释以字典的形式存储在函数的__annotations__属性中，对函数的其它任何部分都没有影响。参数注释用一个冒号在参数名后面定义 , 冒号后面紧跟着一个用于计算注释的表达式。返回值的注释使用 "->"来定义的，是紧跟着参数列表和 def 语句的末尾的冒号之间的一个表达式。下面的示例包含有位置参数，关键字参数和返回值的注释各1个:

 1 >>> def f(bird: str, egg:str ='pain')->str:
 2 ...     print("注释是", f.__annotations__)
 3 ...     print("参数有", bird, egg)
 4 ...     return bird+' and '+egg
 5 ...
 6 >>> f('viki')
 7 
 8 注释是 {'bird': <class 'str'>, 'egg': <class 'str'>, 'return': <class 'str'>}
 9 参数有 viki pain
10 viki and pain

　　仔细看这句 egg:str ='pain' ，其中的'pain'是egg的一个默认值，与str无关。没有注释时应该是这样的，def f(bird, egg='pain')。

　　代码风格 --Style推荐：PEP 0008 -- Style Guide for Python Code

　　如果想同时获取dict中的某个key-value对怎么办？通常在循环迭代字典的时候，键和对应的值通过使用items()方法可以同时得到。具体操作如下：

1 >>> knights = {'gallahad': 'the pure', 'robin': 'the brave'}
2 >>> for k, v in knights.items():
3 ...     print(k, v)
4 ...
5 gallahad the pure
6 robin the brave

　　此外，在序列（list，tuple）中遍历时，使用 enumerate() 函数也可以同时得到索引和对应的值。

1 >>> for i, v in enumerate(['tic', 'tac', 'toe']):
2 ...     print(i, v)
3 ...
4 0 tic
5 1 tac
6 2 toe

　　如果想同时遍历两个或多个序列，使用 zip() 函数可以成对读取元素，这样子可能会引发一些序列的问题，比如多个序列的长度不一，有的就会被裁剪。简单操作例子：

1 >>> questions = ['name', 'quest', 'favorite color']
2 >>> answers = ['lancelot', 'the holy grail', 'blue']
3 >>> for q, a in zip(questions, answers):
4 ...     print('What is your {0}?  It is {1}.'.format(q, a))
5 ...
6 What is your name?  It is lancelot.
7 What is your quest?  It is the holy grail.
8 What is your favorite color?  It is blue.

　　其实zip()函数就是返回一个可迭代对象，每次将传进去的所有参数的同一列的元素给返回了，以至于能同时获取多个序列的同一列的元素。

　　反向遍历，首先可以正向生成这个序列，然后调用 reversed() 函数来将序列反置，注意返回的是一个新的对象：

 1 >>> x=[1,2,3,4,6,8,10]
 2 >>> for i in reversed(x):
 3 ...     print(i)
 4 ...
 5 10
 6 8
 7 6
 8 4
 9 3
10 2
11 1
12 [1, 2, 3, 4, 6, 8, 10]

　　有一点需要特别注意，若要在循环内部修改正在遍历的序列（例如删除某些元素），建议您首先制作副本，因为在序列上循环每次都会读取对象，并不会隐式地创建副本。切片表示法使这尤其方便：

1 >>> words = ['cat', 'window', 'defenestrate']
2 >>> for w in words[:]:  # 关键在这使用切片
3 ...     if len(w) > 6:
4 ...         words.insert(0, w)
5 ...
6 >>> words
7 ['defenestrate', 'cat', 'window', 'defenestrate']

序列和其它类型的比较

　　序列对象可以与同序列类型的其他对象相比较。比较按照‘字典序’进行。如果一个序列是另一个序列的初始子序列，较短的序列就小于另一个。字符串的排序按照Unicode编码点的数值排序单个字符。下面是同类型序列之间比较的一些例子：

(1, 2, 3)              < (1, 2, 4)
[1, 2, 3]              < [1, 2, 4]
'ABC' < 'C' < 'Pascal' < 'Python'
(1, 2, 3, 4)           < (1, 2, 4)
(1, 2)                 < (1, 2, -1)
(1, 2, 3)             == (1.0, 2.0, 3.0)
(1, 2, ('aa', 'ab'))   < (1, 2, ('abc', 'a'), 4)

　　注意，使用< 或者 >比较不同类型的对象是合法的，只要这些对象具有合适的比较方法。例如，不同的数字类型按照它们的数值比较，所以 0 等于 0.0，等等。但也不是任何情况下都是合法的，比如list和tuple比较时，解释器将引发一个TypeError异常。

posted @ 2015-12-20 11:06 xcw0754 阅读(204) 评论(0) 收藏举报

刷新页面返回顶部

xcw0754

关于python的一些笔记

序列和其它类型的比较

公告