python2.x 与 python3.x 的持续更新

阅读目录:

 

print函数

python2.x版本中,python2.6与python2.7部分地支持这种形式的print语法。在python2.6与python里面,以下三种形式是等价的:

1 print "fish"
2 print ("fish")  #注意print后面有个空格
3 print("fish")   #print()不能带有任何其它参数

Python 2.6实际已经支持新的print()语法

1 from __future__ import print_function
2 print("fish", "panda", sep=', ')

python3.x版本   print语句没有了,取而代之的是print()函数。

Unicode

python2有ASCII str()类型,unicode()是单独的,不是byte类型。

现在,在python3,我们最终有了Unicode(utf-8)字符串,以及一个字节类:byte 和bytearrays.

由于python3.x源码文件默认使用utf-8编码,这就使得以下代码是合法的:

1 >>> 中国 = 'china' 
2 >>>print(中国) 
3 china

Python 2.x

1 >>> str = "我爱北京天安门"
2 >>> str
3 '\xe6\x88\x91\xe7\x88\xb1\xe5\x8c\x97\xe4\xba\xac\xe5\xa4\xa9\xe5\xae\x89\xe9\x97\xa8'
4 >>> str = u"我爱北京天安门"
5 >>> str
6 u'\u6211\u7231\u5317\u4eac\u5929\u5b89\u95e8'

Python 3.x

1 >>> str = "我爱北京天安门"
2 >>> str
3 '我爱北京天安门'

以上结果说明python2中的Unicode类型的字符串跟pyton3中的str类型是一样的。可直接进行编码转换为utf-8类型

python2中的str类型会根据操作系统的编码显示为字节

除法运算

python中的除法较其它语言显得非常高端,有套很复杂的规则。python中的除法有两个运算符,/和//

首先来说 / 除法:

在python2.x 中 / 除法就跟我们熟悉的大多数语言,比如Java、C差不多,整数相除的结果是一个整数,把小数部分完全忽略掉,浮点数除法会保留小数点的部分得到一个浮点数的结果。

在python 3.x中/除法不再这么做了,对于整数之间的相除,结果也会是浮点数。

python2.X

1 >>> 1 / 2
2 0
3 >>> 1.0 / 2.0
4 0.5

Python 3.x:

1 >>> 1/2
2 0.5

而对于//除法,这种除法叫做floor除法(地板,向下取),会对除法的结果自动进行一个floor操作,在python 2.x和python 3.x中是一致的。

python 2.x:

1 >>> -1 // 2
2 -1

python 3.x:

>>> -1 // 2
-1

注意的是并不是舍弃小数部分,而是执行 floor 操作,如果要截取整数部分,那么需要使用 math 模块的 trunc 函数

python 3.x:

1 >>> import math
2 >>> math.trunc(1 / 2)
3 0
4 >>> math.trunc(-1 / 2)
5 0

 异常

在 Python 3 中处理异常也轻微的改变了,在 Python 3 中我们现在使用 as 作为关键词。

捕获异常的语法由 except exc, var 改为 except exc as var

使用语法except (exc1, exc2) as var可以同时捕获多种类别的异常。 Python 2.6已经支持这两种语法。

  • 1. 在2.x时代,所有类型的对象都是可以被直接抛出的,在3.x时代,只有继承自BaseException的对象才可以被抛出。
  • 2. 2.x raise语句使用逗号将抛出对象类型和参数分开,3.x取消了这种奇葩的写法,直接调用构造函数抛出对象即可。

 

在2.x时代,异常在代码中除了表示程序错误,还经常做一些普通控制结构应该做的事情,在3.x中可以看出,设计者让异常变的更加专一,只有在错误发生的情况才能去用异常捕获语句来处理。

xrange

在 Python 2 中 xrange() 创建迭代对象的用法是非常流行的。比如: for 循环或者是列表/集合/字典推导式。

这个表现十分像生成器(比如。"惰性求值")。但是这个 xrange-iterable 是无穷的,意味着你可以无限遍历。

由于它的惰性求值,如果你不得仅仅不遍历它一次,xrange() 函数 比 range() 更快(比如 for 循环)。尽管如此,对比迭代一次,不建议你重复迭代多次,因为生成器每次都从头开始。

在 Python 3 中,range() 是像 xrange() 那样实现以至于一个专门的 xrange() 函数都不再存在(在 Python 3 中 xrange() 会抛出命名异常)。

八进制字面量表示

八进制数必须写成0o777,原来的形式0777不能用了;二进制必须写成0b111。

新增了一个bin()函数用于将一个整数转换成二进制字串。 Python 2.6已经支持这两种语法。

在Python 3.x中,表示八进制字面量的方式只有一种,就是0o1000。

python 2.x

1 >>> 0o1000
2 512
3 >>> 01000
4 512

python 3.x

1 >>> 01000
2   File "<stdin>", line 1
3     01000
4         ^
5 SyntaxError: invalid token
6 >>> 0o1000
7 512

不等运算符

Python 2.x中不等于有两种写法 != 和 <>

Python 3.x中去掉了<>, 只有!=一种写法,还好,我从来没有使用<>的习惯

数据类型

1)Py3.X去除了long类型,现在只有一种整型——int,但它的行为就像2.X版本的long

2)新增了bytes类型,对应于2.X版本的八位串,定义一个bytes字面量的方法如下:

1 >>> b = b'china' 
2 >>> type(b) 
3 <type 'bytes'> 

str对象和bytes对象可以使用.encode() (str -> bytes) or .decode() (bytes -> str)方法相互转化。

>>> s = b.decode() 
>>> s 
'china' 
>>> b1 = s.encode() 
>>> b1 
b'china' 

3)dict的.keys()、.items 和.values()方法返回迭代器,而之前的iterkeys()等函数都被废弃。同时去掉的还有 dict.has_key(),用 in替代它吧 。

 

 

 

 

 

我们在Python解释器安装目录的Lib\site-packages目录中新建一个名为sitecustomize.py文件。文件内容为:

# -*- coding: utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

这样的话,在解释器启动时,就会自动去读取该文件,在解释器真正工作之前,我们就把默认编码修改了(Python 2.4版本测试毫无问题)。
这就是一劳永逸的解决办法。大家可以视情况而定,选择什么办法。
一般地,都是声明文件头就行了。因为就目前而言,采用utf-8编码的软件越来越多,并且都可以自定义编码方式。所以,拥抱utf-8吧!

感谢博主连接:https://www.cnblogs.com/Neeo/articles/10684672.htm

 

posted @ 2018-12-17 13:59  小萍瓶盖儿  阅读(316)  评论(0编辑  收藏  举报