python初探

　　python近两年似乎已经很热了，不了解一下怎么能行呢，似乎python最大的优点就是简洁、易懂、优雅。目前豆瓣、知乎等后台服务使用的也都是python语言。 python一般可以用于网站服务、小工具、数据分析等工作。它作为高级语言，和js一样，是解释型语言，所以运行速度上会比较慢，但是在网络服务上，相对于网速的缓慢，运行速度也就不是很大的问题了。

python环境安装

　　在windows环境下，我们可以进入这里下载安装，安装的过程中需要勾选添加到环境变量，这样，在命令行操作过程中就不会出现问题了。安装完成后，打开命令行，输入python，就进入交互模式了，输入exit()，即可退出python环境。另外，这个安装的python环境就是最为通用的python解释器cpython，之所以称为cpython，是因为这个解释器是通过c语言编写的。

简单的例子

　　我们在运行中，输入cmd进入的是命令行模式，而如果输入python，就可以进入python交互模式，因此如果我们希望运行python代码，就需要进入python交互模式，上面的图片也就是python交互模式。

　　我们还可以在进入python交互模式后，输入 print('hello world!') ，即这是python的输出字符串的语法，当然，我们也可以使用print输出多个字符串，需要使用逗号隔开，如 print('hello', 'world', 'wayne')，并且其中也是可以接受数字的，如print(200)。

　　另外，我们可以编辑一个.py后缀的python文件，然后在命令行下运行，即 python foo.py就可以执行这个foo.py文件了。

　　如上，我在sublime编辑器中新建一个foo.py，其中python语句是没有分号和花括号的，因为这样更加接近于自然语言。然后在命令行中运行:

　　这样，一个简单的python程序就出来了。

输入输出

　　python中的输入输出也是非常简单的。

　　输出就是使用print，可以接受多个参数，参数的类型可以是数字也可是字符串，当然字符串中可以有\t和\n等。

　　输入当然也是交互中必不可少的，为name()，这个在执行之后，会提示用户输入，name()函数可以接受一个字符串作为参数，如name('请输入你的名字：')，举例如下：

name = input('请输入你的名字:')
print('你好，', name)

python基础知识

　 python作为计算机语言，那么语言就必须要计算机理解，必须有一定的规则，而不是像自然语言很随意。python的语法是比较简单的，采用的时特有的缩进的方式，并且没有像js那样分号作为语句的结束，且语句在使用 : （冒号）结尾时，缩进的语句视为代码块，缩进没有特定的要求，但是一般以4个空格为准，且python是大小写敏感的。 python中使用#作为注释的标志。且python中不需要声明变量，直接使用就可以了。如下所示：

num = input('请输入一个数字')
if int(num) > 0:
    print('您输入的数字大于0')
elif int(num) < 0:
    print('您输入的数字小于0')
else:
    print('您输入的数字等于0')

我们可以看到python中的else if需要写成elif，否则会报错，这样也正是python简洁的体现，而通过input()函数输入的是一个字符串，在直接判断与0的大小时会出错，所以我们可以使用int()来讲字符串强制转化为数字，就可以进一步的比较了。如下：

python中的数据类型和其他语言都是大同小异的，包括整数、浮点数、字符串、布尔值以及运算。其中布尔值有些许不同，如True表示真，而False表示假，第一个字母需要大写，另外，我们可以使用 and、 or、 not 来表示布尔值的与、或、非运算，这使得python更加接近自然语言。python中使用None表示空值。它的变量同样是大小写英文、数字和_组合，且不能使用数字作为开头。 python是动态语言，因为他的变量类型和js一样是可以变动的，而不像java。另外，python中的除法有两种，一种是普通的 / ，这种方法不管除数和被除数为整数或者浮点数，得到的结果都是浮点数；而 // 这种除法得到的结果总是整数。同样，python使用 % 作为求余的操作符。

python字符串和编码

　　对于字符串而言，最为复杂的就是编码问题了，因为计算机只能处理0/1数字，所以要处理文本，就必须先把文本转换为数字才能处理。

　　1个字节是8个bit，所以一个字节能表示的最大的整数是255，也就是说用一个字节编码的方式可以最多表示255种字符。而最早是美国人发明了计算机，他们使用的语言只有a-zA-Z和其他字符一共127个，即ASCII编码。但对于十万个汉字的编码，显然ASCII编码是做不到，而两个字节可以表示6万多种字符，所以，中文的编码至少需要2个字节，于是中国制定了GB2312编码。 但世界上有上百种文字，日本要把日文编到Shift_jis中，韩国把韩文编到Euc-kr中，显然，这样就没有了统一的标准，而使得有多种文字编码的文本中，很可能出现乱码的情况。

　　因此，Unicode编码应运而生，即union code，统一的编码，这种编码包含了各国文字，使得文本可以通用，而不必担心出现乱码的情况，Unicode编码一般是两个字节，但两个字节只能表示6万多字符，所以有时也会有四个字节的情况，但对于常用的文字，一般都是两个字节。但如果一直使用Unicode编码，问题是如果通篇英文，Unicode编码会比ASCII编码多出一倍的存储空间，这是非常浪费的，于是，又出现了 UTF-8编码，这种编码把一个unicode字符根据不同的数字大小编为1 - 6个字节，常用的英文字母还是1个字节（可以将ASCII编码看做UTF-8编码的一部分），而汉字通常是3个字节，所以如果传输中包含了大量的英文字符，使用UTF-8编码会更加节省空间。　　

　　实际上，在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者传输的时候，就转换成UTF-8编码，如浏览网页的时候，服务器会把动态生成的Unicode内容转换成UTF-8再传输到浏览器。这样我们也就理解HTML文件中 <meta charset="UTF-8"/>的含义了。

　　而python中字符串也是Unicode编码的，即它支持多种语言，而不会出现乱码。对于单个字符的编码，python提供了ord()函数获取字符的整数表示（Unicode编码的整数表示），chr()函数把编码转换为对应的字符。

　　而如果我们知道字符的整数编码，还可以用十六进制来写str，如

>>> '\u4e2d\u6587'
'中文'

　　其中，\u这个转义字符表示Unicode编码，而4e2d是十六进制的编码，即中这个汉子用了两个字节来表示，同样文也用了两个字节来表示。

　　另外，Python中提供了encode()函数和decode()函数来进行编码和解码，len()函数来返回字符长度。

　　在python中，也经常需要格式化，和c语言是非常类似的，%s为字符串，%d为整数，%f为浮点数，%x为十六进制数，并且如果在表示中有%我们需要进行转义%%，另外，如果不知道该用哪个占位符，统一使用%s就可以了。format()函数也是同样的表达方式，但相对于前者还是稍显复杂，如下所示：

使用list和tuple

　　在c++中有List和tuple这两种数据类型，而在python中同样也有。 list比tuple有更多的操作方法，但是tupple一旦定义不能被改变，因而更加安全，下面做简单介绍。

　　如上所示，我们可以直接定义rel = ['wayne', 'hedy', 'baby']这个list，使用len()函数可以获取这个list的长度，使用rel[0]这种下标可以获取其中的元素，通过append()可以将元素添加到末尾，通过pop()可以弹出（删除）最后一个元素，我们还可以通过insert()将元素插入到指定位置，使用pop(num)将指定位置的元素删除，并且使用 rel[num] = str的方式直接替换list中的某个元素。因此，list数据类型还是非常方便，操作起来更为简单、强大。

　　tupple和list非常类似，只是在定义的时候使用的时()而非[]，并且最为本质的区别在于tupple一旦定义只能访问不能修改，当然也就没有append、insert、pop这些方法了，优点就是更安全，如果可以使用tupple就尽量不要使用list。

　　可以看到，我们定义了rel之后，只能进行访问，而在试图修改时发生了错误。

循环

　　python中有两种循环。一种是使用for...in循环，另外一种便是while循环。　

rel = ['wayne', 'hedy', 'baby']
for name in rel:
  print(name, '\n')

　　以上是使用for...in循环rel这个list，注意，以为for下一行缩进，所以for语句后有 : （冒号）。

　　另外，python中提供了range函数，如list(range(50)) 可以生成一个0到49的list，而不需要我们手写了。同样，for...in也可以使用range，如下：

max = int(input('请输入一个正整数：'))
sum = 0
for a in range(max + 1):
  sum = sum + a
print('1到%d' % max, '的和为：',sum )

　　运行结果如下所示：

　　而while循环和其他语言的循环也是类似的，如下所示：

import time
n = int(input('请输入一个正整数：'))
while n > 0:
  print(n, 's\n')
  time.sleep(1)
  n = n - 1
print('over!')

这里我们在python文件中直接引入了time模块，通过time模块的sleep函数使得程序在运行到这一语句时暂停1s中而继续运行。　

　　同样的，在python中也可以正常使用break和continue关键词。

dict和set

　　在c++中提供了map这样的数据结构，这种数据结构是含有多个k-v对，具有一一映射的特点，而在python中也提供了同样的数据结构，只是名称为dict，即dictionary字典，使用起来非常简单。且list使用的时[]，tuple使用的时()，这里的dict使用的是{}，如下：

　　如上所示，我们使用{}来定义这个dict，并且可以使用d[key]的方式获取到它的值，另外dict提供了get方法来查找相应的value，当然，如果不存在，则什么也不会返回。且可以通过d[key]的方式来添加映射。通过pop()函数来删除其中的某个k-v对。注意：dict中的key是不能重复的。

　　那么set是怎么样定义的呢？set和dict非常类似，但是set中只有key而没有value，相同点在于key都是不能重复的，如果重复，则也会自动过滤， set有add方法添加key，通过remove方法删除， set可以看成数学意义上的无序和无重复元素的集合，因此，两个set可以做数学意义上的交集、并集等操作。如下所示：

　　如上所示：我们可以看到，set()函数中实际上就是一个list，通过add添加key，通过remove删除key，通过s1 = s来赋值，且两个set之间可以进行并集和交集的运算。

　　另外，我们可以看到，这里s3本来是有重复数字的，但在建立后生成时，重复数字会自动被删除，这便是set的一大特点。

python函数

　　python中内置了很多函数，比如之前的chr()等，这些函数是可以直接调用的，文档中查看更多内置函数。https://docs.python.org/3/library/functions.html#abs

　　比如abs即求绝对值的函数、max函数返回多个参数中最大的一个、min函数等等。更多示范可以看另外一篇文章。

python切片

　　即和js中的slice方法是类似的，但是python中是没有slice的，而是使用了更为简单的方式，如下：

>>> L = [0,1,2,3,4,5,6,7,8,9,10]
>>> L[0:3]
[0, 1, 2]
>>> L[:3]
[0, 1, 2]
>>> L[2:4]
[2, 3]
>>> L[-2:]
[9, 10]
>>> L = list(range(20))
>>> L
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
>>> L[0::2]
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
>>> L[::2]
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
>>> "wayne-zhu"[0:5]
'wayne'
>>> t = (1, 56, 74, 85, 9)
>>> t[0:3]
(1, 56, 74)

　　即对于list而言，指定开始和结束的后一个位置，即可进行切片；

如果是从0开始，则数字0是可以省略的；

如果是负数，就是从倒数第几个开始，最后一个是-1；

我们还可以指定每隔几个数取出一个数出来；

字符串也可以看成一种list，也是可以用类似的方法的；

　　tupple和list一样，只是tupple不可变，但也是可以使用这样的方法。

　　下面是使用python定义的trim函数，实现方式如下：

def trim(str):
  old = str
  i = 0
  while True:
    if str[i] == ' ':
     str = str[1:]
    else:
      break

  j = len(str) - 1
  while True:
    if str[j] == ' ':
      str = str[0:j]
      j = len(str) - 1
    else:
      break

  print(old,'trim之后为：',str,'trim之后的字符长度为', len(str))

trim('   wayne       ')

　　我们首先将str保存起来，然后对字符串的前半部分进行处理 - 如果第一个字符是空格就slice；对于字符串的后半部分做出同样的处理。结果如下：

C:\Users\Administrator\Desktop>python foo.py
   wayne        trim之后为： wayne trim之后的字符长度为 5

python迭代

　　在js、c、c++等编程语言中，for循环都是大同小异的，如for(int i = 0; i < 10; i++)，而在python中，for循环变得更加抽象了，如下所示：

d = {'wayne': 22, 'hedy': 18, 'baby': 0}
print('key:')
for key in d:
  print(key)

print('\nvalue')

for value in d.values():
  print(value)

print('\nkey and value')
for k,v in d.items():
  print(k, v)

　　结果如下：

key:
wayne
hedy
baby

value
22
18
0

key and value
wayne 22
hedy 18
baby 0

　　另外，字符串也是可迭代对象。

print('\n 字符串的迭代：')
s = 'wayne-zhu'
for ch in s:
  print(ch)

　　这样，可以依次将字符打印出来。

　　那么我们如何判断一个对象是否为可迭代对象呢？可以通过collections模块的Iterable类型判断：

from collections import Iterable
print(isinstance('wayne', Iterable)) #True
print(isinstance([1, 2, 3], Iterable)) #True
print(isinstance(888, Iterable)) #False

　　如上所示，我们通过isinstance就可以判断了。这里其实是判断'wayne'、[1, 2, 3]、888是否是Iterable这个类的实例。 该函数返回一个布尔值，True或者False。

　　另外，list是没有下标的，我们怎么实现呢？可以使用enumerate()函数，如下所示：

L = [666, 888, 520, 521, 1314]
for k,v in enumerate(L):
  print(k, v)

　　最终结果如下所示：

　　可以看到，这样我们就可以获得下标了。

练习：使用迭代的方法获得一个list中的最大值和最小值，并返回这个list的tupple：

L = [666, 888, 520, 521, 1314]
max = L[0]
min = L[0]
for k,v in enumerate(L):
  if L[k] > max:
    max = L[k]
  if L[k] < min:
    min = L[k]

print(max, min)
print(tuple(L))

结果如下；

1314 520
(666, 888, 520, 521, 1314)

python列表生成式

　　生成1到10的列表，使用下面的语法：

>>> list(range(1, 11))
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

　　如果要生成[1 * 1, ... 10 * 10]的列表呢？

>>> [x * x for x in range(1, 11)]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

　　上面这种语法是常见的，即直接将迭代式子写在[]中，前半部分是我们所需要的表达式。

　　另外，对于字符串而言，我们通常需要生成某个字符的全排列，可以这样：　　

>>> [m + n for m in 'xyz' for n in 'xyz']
['xx', 'xy', 'xz', 'yx', 'yy', 'yz', 'zx', 'zy', 'zz']

　　上面的式子就生成了xyz的全排列，xx、xy、xz、yx、yy、yz、zx、zy、zz，当然我们还可以生成不同字符串之间的全排列，这是非常有用的。

　　下面的代码还可以将list中的所有字母编程小写：

>>> L = ['WAYNE', 'HEDY', 'BABY']
>>> [s.lower() for s in L]
['wayne', 'hedy', 'baby']

　　其中 lower() 函数是将字符串转化为小写，而upper()函数可以将字符串转化为大写，如下所示：

>>> wayne = ['wayne', 'hedy', 'baby']
>>> [s.upper() for s in wayne]
['WAYNE', 'HEDY', 'BABY']

　　注意：上面的s.upper()也可以写成 str.upper(s)， lower同理。

　　另外，如果我们的L为['Wayne', 'Hedy', 18, None]如果直接使用列表生成式会因为18不是字符串而出错：

>>> L = ['Wayne', 'Hedy', 18, None]
>>> [str.lower(i) for i in L]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 1, in <listcomp>
TypeError: descriptor 'lower' requires a 'str' object but received a 'int'

　　我们试着使用if语句以及isinstance来修改：

>>> [str.lower(i) for i in L if isinstance(i, str)]
['wayne', 'hedy']

　　即在这个列表生成式中直接加入if语句，然后使用isinstance判断i是否是str(字符串)类型即可。

python生成器

　创建一个列表就会打印出所有的元素，而如果这个列表的元素很多而我们仅仅需要访问其中的前几个元素，那么生成整个列表就会造成浪费。而如果列表元素可以按照某种方法算法推算出来，那么我们是否可以在循环的过程中不断地推算出后续的元素呢？这样就不必创建完整的list，而节省了大量的空间。在python中一边循环一边计算后续元素的机制，就称为生成器。

　　比如，我们创建了一个1到100的list，如下：

>>> list(range(1, 100))
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]

　　但如果我们只需要1到100的前几个元素，那么后续元素占用的内存就造成了浪费。而生成器（generator）是下面这样的：

>>> g = (x for x in range(1, 100))
>>> g
<generator object <genexpr> at 0x02C41E70>

　　如果我们希望访问其元素，可以使用next()进行访问，next函数接受一个参数，即这个生成器g，如下所示：

>>> next(g)
1
>>> next(g)
2
>>> next(g)
3
>>> next(g)
4
>>> next(g)
5

　　如上所示，每调用一次next()函数，就会返回生成器的下一个元素，生成之后，才会给这个元素分配内存，这样便大大节省了内存空间，即做到按需分配。

　　又比如下面的生成器：

>>> g = (x for x in range(1, 5))
>>> g
<generator object <genexpr> at 0x02C6F0F0>
>>> next(g)
1
>>> next(g)
2
>>> next(g)
3
>>> next(g)
4
>>> next(g)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

　　可以看到，这里我们定义了元素从1到4的生成器，打印g，显示g为一个generator，然后调用next()函数，返回generator的元素，每调用一次，返回下一个元素，但是当最后一个元素4已经打印出来后，再调用next()，就会报错：即stopIteration，停止遍历。

　　当然，更多情况下，我们还可以使用for来遍历生成器，因为生成器是可遍历的，如下：

g = (x * x for x in range(1, 5))
for n in g:
  print(n)

　　打印出的结果如下所示：

C:\Users\Administrator\Desktop>python foo.py
1
4
9
16

　　上面，我们都是直接使用()加表达式生成了一个生成器，但如果推算较为复杂的情况下，我们还可以使用函数的方式。首先，我们可以看到如果斐波那契数列的函数生成：

def fib(max):
  n, a, b = 0, 0, 1
  while (n < max):
    print(b)
    a, b = b, a + b
    n = n + 1
  return 'done'

fib(5) # 1 1 2 3 5

这里需要注意：python中定义变量更为简洁，即这里的n, a, b = 0, 0, 1简洁的一句代码便定义了三个变量
a, b = b, a + b的定义也是非常简洁，这里没有使用中间变量保存a，而是使用了tupple的数据结构，即t = (b, a + b)、 a = t[0]、 b = t[1]。

　　而如果我们这里将 print(b) 修改为 yield(b)，就是一个生成器了。对于生成器来说，每次yield的时候，都会暂停，必须使用next()才能继续执行下面的程序。所以就成了生成器了。而对于生成器来说，我们使用for..in来调用会更加方便一些：

def fib(max):
  n, a, b = 0, 0, 1
  while (n < max):
    yield(b)
    a, b = b, a + b
    n = n + 1
  return 'done'

g = fib(5) # 1 1 2 3 5

for x in g:
  print(x)

　　如上所示：我们可以看到这时的fib就是一个生成器了，且可以使用for...in遍历。

python迭代器

　　之前我们提到过："abc"、[]等都是Iterable（可迭代的），但是他们并不是迭代器，如下所示：

>>> from collections import Iterable
>>> isinstance([], Iterable)
True
>>> isinstance({}, Iterable)
True
>>> isinstance('abc', Iterable)
True
>>> isinstance((x for x in range(1, 10)), Iterable)
True
>>> isinstance(628, Iterable)
False

　　我们可以看到：[]、{}、'abc'、(x for x in range(1, 10))都是可迭代的，只有628这个数字肯定不是的。如果换做迭代器呢？

from collections import Iterator # 注意：这里import要换做Iterator
print(isinstance({}, Iterator)) #False
print(isinstance('abc', Iterator)) #False
print(isinstance((x for x in range(1, 10)), Iterator)) #True
print(isinstance(628, Iterator)) #False

　　这里，我们可以看到，只有（x for x in range(1, 10)）是迭代器，其他都不是迭代器，这是为什么呢？

>>> g = (x for x in range(1, 10))
>>> next(g)
1
>>> next(g)
2
>>> next(g)
3
>>> next(g)
4

　　我们可以看到，(x for x in range(1, 10))这个表达式可以调用next函数，知道最后元素迭代完成，会报错：stopIteration。

　　而'abc'呢？如下所示：

>>> g = 'abc'
>>> g
'abc'
>>> next(g)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'str' object is not an iterator

　　如上所示：使用'abc'的next函数时，会直接报错：'str' object is not an iterator。即字符串不是一个迭代器。对于list、disc也同样如此，所以这里只有tupple才是Iterator。

>>> g = {'wayne':22, 'hedy': 18}
>>> g
{'wayne': 22, 'hedy': 18}
>>> next(g)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'dict' object is not an iterator

于是有：可以被next()函数调用并不断返回下一个值的对象称为迭代器：Iterator。

　　　但是，我们是可以将非Iterator强制转换为Iterator的。使用iter()函数即可。但前提是它们必须是Iterable，对于628这样的not Iterable的类型，使用iter()也是无济于事的。如下所示：

>>> s = 'abc'
>>> s
'abc'
>>> i = iter(s)
>>> i
<str_iterator object at 0x039F4670>
>>> next(i)
'a'
>>> next(i)
'b'
>>> next(i)
'c'

　　　628不是Iterable，如下：

>>> n = 628
>>> i = iter(n)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'int' object is not iterable

　　可以看到，对于int类型的628，如果使用iter，也是会报错的 --- 'int' object is not iterable

　　那为什么list不是Iterator呢？这是因为Iterator是惰性的，并没有一次性获取到所有的数据，是无限制的，而list是一开始就存储了数据。

高阶函数

　　即函数中接受函数作为参数的函数就是高阶函数。如map、filter等。又如sorted函数，如下：

>>> sorted([35, -56, 85, 69])
[-56, 35, 69, 85]
# 如上，这里没有接受函数作为参数，只是按照从小到大的排序

>>> sorted([35, -56, 85, 69], key=abs)
[35, -56, 69, 85]
# 这里我们接受了abs函数作为第二个参数，即按照其绝对值大小进行排序

>>> sorted(['bob', 'about', 'Zoo', 'Credit'])
['Credit', 'Zoo', 'about', 'bob']
#这里我们直接对字符串进行排序

>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower)
['about', 'bob', 'Credit', 'Zoo']
#这里我们将所有的字符串按照转化为小写字母之后进行排序

>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)
['Zoo', 'Credit', 'bob', 'about']
#如果我们希望反向，只需要再添加一个参数 -- reverse = True

　在python中，也是存在匿名函数的概念的，如下：

>>> f = lambda x: x * x
>>> f(5)
25

　　如上所示：等式右边的就是一个匿名函数，而 lambda 关键词就表示在声明一个匿名函数，冒号之前的x表示接受的参数，之后表示返回的值。

python装饰器

　　如下所示：定义一个now函数，因为函数是一个对象，所以可以赋值给f（另外一个变量），然后我们再调用这个函数即可。

>>> def now():
...     print('20180324')
...
>>> f = now
>>> f()
20180324

　　在python中，我们可以调用now或者f的__name__属性，以获取到该函数的函数名：如下：

>>> now.__name__
'now'
>>> f.__name__
'now'

　　那什么是装饰器呢？比如，我们希望函数调用前后自动打印日志，但是又不希望修改now()函数的定义，这种在代码运行期间动态增加功能的方式，称之为装饰器。并需要用到@的Python语法。

　　下面我就定义一个装饰器函数用于打印日志：

def log(func):
  def wrapper(*args, **kw):
    print('call %s():' % func.__name__)
    return func(*args, **kw)
  return wrapper

　　这个装饰器函数就是一个高阶函数（接受一个函数作为参数），然后定义了一个wrapper函数返回fun()执行后的结果。然后我们将Log置于函数的定义处：

def log(func):
  def wrapper(*args, **kw):
    print('call %s():' % func.__name__)
    return func(*args, **kw)
  return wrapper

@log
def now():
  print('20180324')

now()

　　我们执行之后，得到如下结果：

call now():
20180324

　　至于上面的格式，即将@log放在了now函数的定义之前，相当于在定义之后执行了函数 now = log(now)，即把这个now函数从新进行了包装、修饰，即为装饰器函数。因此，我们写成下面的方式也是可以的：

def log(func):
  def wrapper():
    print('call %s():' % func.__name__)
    return func()
  return wrapper

@log
def now():
  print('20180324')

now()

　　之前添加了的一些参数是为了更多的使用扩展性。即now()函数执行之后，即调用了这个装饰器函数@log，返回了wrapper函数，最后我们调用now()，就执行了这个wrapper函数，并返回结果。

　　这里，我们可以将@log解释为如下的执行方式:

def log(func):
  def wrapper():
    print('call %s' % func.__name__)
    return func()
  return wrapper

def now():
  print('20180324')

now = log(now) # 这样，会fanhuiwrapper函数，然后调用now，就是执行了wrapper函数，首先打印了内容，再执行真正的now函数。

now()

　　上面是最简单的方式，而如果这个装饰器自身需要接受参数，那么如果使用上面的这种方式就无法满足了，我们必须再包裹一层函数，如下所示：

def log(text):
  def decorator(func):
    def wrapper():
      print('call %s %s' % (text, func.__name__))
      return func()
    return wrapper
  return decorator  

@log('extro')
def now():
  print('20180324')

now()

　　思路非常明确，即包含了一层decorator函数，我们将text传给装饰器，实际上，@log('extro')的另外一种真是的写法如下：

def log(text):
  def decorator(func):
    def wrapper():
      print('call %s %s' % (text, func.__name__))
      return func()
    return wrapper
  return decorator  

def now():
  print('20180324')

now = log('extor')(now)

now()

　　最终的结果如下：

call extor now
20180324

　　但这里还是有问题的，当我们在程序的最后加上 print(now.__name__)的时候，我们可以发现最终输出的时 wrapper 而不是 now，这不是我们希望看到的，而我们修改之后最终的结果如下：

import functools

def log(text):
  def decorator(func):
    @functools.wraps(func)
    def wrapper():
      print('call %s %s' % (text, func.__name__))
      return func()
    return wrapper
  return decorator  

def now():
  print('20180324')

now = log('extor')(now)

now()

print(now.__name__)

python偏函数

　　偏函数还是很好理解的，我们从一个简单的例子说起。

　　比如我们可以使用int('1000')将字符串'1000'转化为数字，这个转化过程默认是十进制的。而如果我们希望转化为2进制的，我们可以这样调用：int('1000', base=2)或者是int('1000', 2)。但是如果我们需要大量的转化为二进制数字的调用，每次都int('1000', 2)难免比较麻烦，所以我们可以封装为一个函数再调用，如下：

def int2(str):
  return int(str, base=2)

print(int2('100')) #4
print(int2('10')) #2
print(int2('1')) #1

　　如上所示，这样，我们就可以很轻松的进行转化了。但python中的functools模块本身有这个作用，如下：

import functools
int2 = functools.partial(int, base=2)

print(int2('100')) #4
print(int2('10')) #2
print(int2('1')) #1

　　即这里我们使用了functools.partial函数，这就是偏函数，即把一个函数的某些参数给固定住（也就是设置为默认值），返回一个新的函数，调用这个函数会更加简答。而我们也可以继续个性化，如下：

import functools
int2 = functools.partial(int, base=2)

print(int2('100',base=10)) #100
print(int2('10')) #2
print(int2('1')) #1

　　如上，可以看出来，这个和我们上面自己定义的int2是相同的，总之，偏函数可以固定住某些参数，使我们的操作更加简单。

python模块

　　和JavaScript是类似的，大多数编程语言都是要进行模块化开发的，因为当工程越来越复杂的时候，不可能始终使用一个文件，而是根据程序块的不同作用分配到模块中，这样，有利于开发的高效性，另外，同一个模块还可以在多处使用，这样有利于提高程序的重用性，python也不例外。　　

　　python中，一个.py文件就可以看做一个python模块，模块很好地解决了变量命名冲突的问题，并且通过模块，但当模块多时，也不可避免出现重名，在python中也就有了包的概念，如一个mymodule包，下面有util.py模块、anto.py模块，并且一定还有一个__init__.py模块，如果没有，Python将不认为mymodule是一个包，通过这个包，我们的模块名称更具辨识性，如util.py模块又称为mymodule.util模块等等。

　　使用模块我们很清楚，直接import 即可，但是如果自定义一个自己的模块呢？如下所示（该文件名为hello.py）：

'my first module'

__author__ = 'Wayne Zhu'

import sys

def test():
  args = sys.argv
  if len(args) == 1:
    print('hello world!')
  elif len(args) == 2:
    print('hello %s' % args[1])
  else:
    print('Too many arguments!')

if __name__ == '__main__':
  test()

　　Ok！这就是一个标准的模块了，其中'my first module'是这个py文件的第一个字符串，默认为该文件的说明性注释；而__author__ = 'Wayne Zhu'中的__author__是专有变量，是声明这个文件的作者，接下来我们引入了sys模块，通过这个模块我们可以获得用户在命令行输入的参数；最后我们判断__name__是否为__main__，如果是执行当前文件，则是，作为入口文件，当然是main，如果是被其他Python文件调用，则不是。

　　其中，sys的argv参数是命令行的参数，如python hello，则argv是一个list，且数量至少为1，这里就是['hello']，而如果用户执行时是 python hello wayne-zhu，则sys.argv的元素个数为2，即['hello', 'wayne-zhu']。

　　该模块如果被直接调用，最终的结果如下：

C:\Users\Administrator\Desktop>python hello.py
hello world!

C:\Users\Administrator\Desktop>python hello.py wayne-zhu
hello wayne-zhu

C:\Users\Administrator\Desktop>python hello.py wayne hedy
Too many arguments!

　　而如果我们是在python交互环境中引入hello模块，则不会有输出，如下：

>>> import hello
>>> hello.test()
hello world!

　　但是我们可以直接通过hello调用test函数。

python变量

　　这里主要说的还是变量的可访问性。

公开变量，abc/foo等，这些变量是公开的，允许被模块内外访问的。
模块内变量/私有变量，_abc、_foo等，即简单的通过_来确定，但实际上语法并没有限制，只是方便程序员观察使用。
特殊变量，__name__、__author__等，这些变量和公开变量并没有什么区别，只是他们有特殊的用途，如__author__表示当前模块的作者名; __name__和'__main__'判断是否相等来判断是直接执行还是间接调用。

def _private_1(name):
    return 'Hello, %s' % name

def _private_2(name):
    return 'Hi, %s' % name

def greeting(name):
    if len(name) > 3:
        return _private_1(name)
    else:
        return _private_2(name)

　　比如上面的例子中，_private_1和_private2是模块内使用的，而greeting是暴露出去的，可以被其他的模块使用。

　　hello.py如下：

'my first module'

__author__ = 'Wayne Zhu'

import sys

def test():
  args = sys.argv
  if len(args) == 1:
    print('hello world!')
  elif len(args) == 2:
    print('hello %s' % args[1])
  else:
    print('Too many arguments!')

def speak(str='great!'):
  print(str)

if __name__ == '__main__':
  test()

View Code

　　foo.py如下：

import hello
hello.test()
hello.speak('I am handsome')

　　当我们执行foo.py时，最终的结果如下：

hello world!
I am handsome

　　可见，我们成功的在foo.py中引用了hello模块，并使用了hello模块暴露的speak函数和test函数，但是根据hello模块test编写形式而言，test主要是为了作模块内测试的，并非暴露给其他模块使用。但语法上并没有任何问题。

安装第三方模块

　　我们在命令行中输入pip，如果正常，则说明可以通过pip安装第三方模块，这个和前端中的npm是类似的，并且，一般的开发者如果要提供自己的模块，需要到pypi.python.org中注册，和前端需要到npm.org中注册时一样的，比如我们要安装该库的名称是 Pillow，那么安装Pillow的命令就是：

pip install Pillow

　　如下所示：

C:\Users\Administrator\Desktop>pip install Pillow
Collecting Pillow
  Downloading Pillow-5.0.0-cp36-cp36m-win32.whl (1.4MB)
    100% |████████████████████████████████| 1.4MB 655kB/s
Installing collected packages: Pillow
Successfully installed Pillow-5.0.0
You are using pip version 9.0.1, however version 9.0.3 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.

　　但是，这里下载的位置在C:\Users\Administrator\AppData\Local\Programs\Python\Python36-32\Lib\site-packages，所以，如果我们希望自己新建一个py文件可以import Pillow，就必须要将Pillow这个文件夹放在和当前py文件的同级目录下，否则就引入不了。

　　同样的，Flask这个web框架就是python框架，安装如下：

pip install flask

　　然后，我们再新建下面这个文件：

from flask import Flask

app = Flask(__name__)

@app.route('/')
def hello_world():
  return 'Hello Flask!'

if __name__ == '__main__':
  app.run()

　　然后在命令行中执行这个文件：

C:\Users\Administrator\Desktop>python foo.py
 * Running on http://127.0.0.1:5000/ (Press CTRL+C to quit)

　　于是我们就可以看到浏览器如下：

　　即通过这个Flask库，我们就自己快速搭建了一个服务器。但是我们可以发现一个问题，就是每次在我们修改文件内容时，比如返回 Hello Wayne!，然后我们去刷新浏览器，但显示内容并没有刷新，这是因为我们没有开启DEBUG模式，如果要开启，我们需要在环境变量中添加 FLASK_DEBUG, 值为1，如下：

　　这样，我们在运行该文件时，内容时这样的：

C:\Users\Administrator\Desktop>python foo.py
 * Restarting with stat
 * Debugger is active!
 * Debugger PIN: 109-984-470
 * Running on http://127.0.0.1:5000/ (Press CTRL+C to quit)

　　即调试模式开启，我们就可以进行调试了。且每次我们修改文件并保存后，服务器就会重启，然后我们刷新浏览器，内容就会发生改变了！这方面的使用还是比node更加方便一些。

　　另外还有很多有用的模块，如果我们都这样下载，未免太慢，所以推荐使用Anaconda，这个平台一旦下载就意味着下载了数十个库文件，这样是非常有用的，我们可以在这里下载。　　

　　安装完成之后，输入python，我们就可以看到Anaconda的相关信息了。然后，对于一些常见的模块我们就不需要再自己下载，而是直接使用即可。但有些情况下，安装之后输入python还是没用，这时我们可以将anaconda的安装路径加入到path中即可，如：

　　注意：现在，不下载也是可以的，最多全部下载一遍，不适用Anaconada也是一样的，不必过分纠结。

　　另外，之前我们说过：每次install一个模块之后，可以通过everything这个工具找到该文件，然后将当前python文件和库文件放在同级目录下才可以使用，但这样比较麻烦，我们可以将存放install的库的路径加入到sys模块的path变量中，这样我们就不用每次都把下载到的文件再手动放在一起了。

 import sys
>>> sys.path
['', 'C:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python36-32\\python36.zip', 'C:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python36-32\\DLLs', 'C:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python36-32\\lib', 'C:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python36-32', 'C:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python36-32\\lib\\site-packages']
>>> sys.path.append('C:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python36-32\\Lib\\site-packages')

　　我们可以看到：这里的sys.path是一个list，所以可以使用append方法来添加元素。

参考文章：廖雪峰博客、python文档

posted @ 2018-03-19 21:50 Wayne-Zhu 阅读(616) 评论(0) 收藏举报

刷新页面返回顶部

曾经，我非常羡慕那些人见人爱的人，我也想要变成那样，可是后来我才明白人见人爱也是需要天赋的，后来我开始默默努力，我想，就算我不能让每个人都喜欢我，至少因为我做的努力能得到别人的尊重。

Wayne Zhu

Keep looking, don't settle.