Python入门

计算机本身不能识别高级语言，当我们运行一个程序的时候，需要一个“翻译” 来把高级语言转换成计算机能读懂的语言。 “翻译”过程分两种：

编译编译型语言在执行程序前，首先会通过编译器执行一个编译的过程，把程序编译成机器语言。之后，程序再次运行的时候，就不要“翻译”了，而是可以直接执行。比如C语言。编译型语言的优点在于在运行程序的时候不用解释，可直接利用已经翻译过的文件。
解释解释型语言就没有编译的过程，而是在程序运行的时候，通过解释器逐行解释代码，然后运行。比如python

文件编码

ASCII（美国(国家)信息交换标准(代)码），使用7个或8个二进制位进行编码的方案，最多可以给256个字符。使用了ASCII码，不同的计算机之间就可以实现数据的标准化。
但是ASCII使用的时候有一些限制。他最多之可以表示256个字符。如果有其他的字符就无能为力了。ASCII只能表示26个基本的拉丁字母、阿拉伯数字和英式标点。因此也只能用于显示现代美国英语。
后来计算机世界开始有了其他语言，ASCII码已经无法满足需求。后来不同语言的人各自为自己定制了一套属于自己的编码，同时与ASCII保持兼容。这些编码统称MBCS，到了这里大家都开始好似用双字节。（中国的叫GB*，比如GBK）.
在后来有人开始觉得，这么多编码，有些编码之间还不兼容，太让人头大了，于是有这么一群人就坐在一起想出了一个办法：所有的语言都使用同一种编码，这种编码就是Unicode。 Unicode使用最少2个字节（1个字节=1BYTE=8bit=一个长度为8的二进制数）来表示字母和符号等,有时候是4个字节。这样就解决了上面遇到的问题。
Unicode又叫万国码，是业界的一种标准。但是有人又觉得如果我要表示一个ASCII里的字符，使用unicode来表示不是太浪费空间了吗，于是就有人想出了另外一种解决方案——UTF-8。
UTF-8是对Unicode编码的压缩和优化，最大的特点是它采用了变长的编码方式，他不再是最少使用2个字节，而是将所有的字符进行分类。ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存，东亚的字符用3个字节保存…

python2中文件的默认编码为ASCII，在文件中含有中文的时候就会报错，这时，我们需要是设置一下文件的默认编码，如下：

#!/usr/bin/env python 
# -*- coding: UTF-8 -*-  # 指定python文件编码方式

在python3中，文件的默认编码为UTF-8，已经不存在这个问题。

posted @ 2020-03-18 13:18 眯眯眼森阅读(59) 评论(0) 收藏举报

刷新页面返回顶部

眯眯眼森

Python入门

公告