Python(Head First)学习笔记:三

3 文件与异常:调试、处理错误、迭代、改进、完善

 处理错误:利用Python的异常处理机制来处理异常情况。

    程序外部的数据:大多程序基本模型:首先输入数据,进行处理,然后存储、显示、打印或传输。

    Python从文件读取数据:Python的open()BIF就是用来与文件交互的,结合for语句使用,可以非常容易地读取数据。

      使用open()流程:读取文件数据时,Python会创建一个迭代器,从文件向代码输入数据行,一次传入一行数据。

 实例:

   打开终端,输入:python3

          import os

          os.getcwd()  #获取当前工作目录

          os.chdir('包含数据文件的文件夹目录')

          data=open('DataFile.txt')

          print(data.readline(),end='') #输出数据文件第一行数据

          print(data.readline(),end='') #输出数据文件第二行数据 

          data.seek(0)         #用seek()方法返回文件起始位置    

          for each_line in data:           #使用迭代的方法逐行输出数据文件

             print(each_line,end=' ')

          data.close()               #关闭数据文件

进一步查看数据

  split()方法返回一个字符串列表,然后赋值到一个目标标识符列表,

  通过将split()方法关联到输出变量,可以完成对数据文件的分割;

        如:A:I am a cool boy!

          用each_line.split(":")这句话可以分解成A和I am a cool boy!

          用(role,line_spoken) = each_line.split(“:”),来获取分解后的数据。

        实例:

          data = open('DataFile.txt')

          for each_line in data:

            (role,line_spoken)=each_line.split(':')  #需要缩进

            print(role,end='')           #缩进长度和上面一样

            print(' said: ',end='')

            print(line_spoken,end='')

了解数据的内容

  针对split()方法,上面的实例中,通过(role,line_spoken)=each_line.split(':')  这句代码,实现了将冒号":"分成两部分,

    然后分别赋值给role和line_spoken,但是当单行中出现多个冒号,就会报错:too many values to unpack。

  为了找到这个错误的原因,通过help(each_line.split)来查看:

    split()有一个可选参数,用于设置分割的数量,将其设置为1,则只会分解成两个部分,

    所以,可以将(role,line_spoken)=each_line.split(':') 这行代码改为(role,line_spoken)=each_line.split(':',1)即可。 

更好的了解数据内容

  仍然针对split()方法,当数据行中没有冒号时,split(':',1)无法查找到,所以就会报错:need more than 1 value to unpack。

  由此引发了一个思考:如果数据文件中存在大量的这种没有冒号,或符合split()方法的判定,那么一定会报各种错误,该如何解决呢?

            有两个方向可以考虑:1 增加额外逻辑,确定是否需要调用split()方法;

                      2 不断调试,直到错误都解决。

  方法一:增加额外逻辑

      find()方法的引入,可以通过find()来尝试找出一个字符串中的子串,如果没有找到返回值是-1,如果找到了返回该子串在字符串中的索引位置。

      实例:>>>each_line = "I tell you, there'no such thing as a flying circus."

         >>>each_line.find(':')

        返回值为-1,因为字符串中没有包含冒号;

        修改字符串为:>>>each_line = "I tell you: there'no such thing as a flying circus."

               >>>each_line.find(':')

        返回值为10,正好是字符串的第10个字符,从0开始计下标,空格也算一个字符。

    现在可以通过这个find()方法来改进上面的实例,具体如下:

          data = open('DataFile.txt')

          for each_line in data:

           if not each_line.find(':')==-1:  #这里增加了一个判断,即:如果找到了冒号,则继续执行,用到了not关键字。

            (role,line_spoken)=each_line.split(':')  #需要缩进

            print(role,end='')           #缩进长度和上面一样

            print(' said: ',end='')

            print(line_spoken,end='')

          data.close()

    注:not关键字是对值进行取反的意思。

    问:为什么要用取反,而不是if each_line.find(':')>=0?这个有待进一步学习,感觉取反会更快些吧~

  方法二:处理异常

    当程序运行报错时,Python解释器会显示一个tranceback,后面跟一个错误消息,这个错误消息就异常(exception)。

    先尝试运行代码,然后处理可能发生的错误。

    try/except机制的引入

      基本格式:try:

             代码内容(可能包含未知错误)

           except:

             错误回复代码

    找出要保护的代码

      对于上面的实例可以改为:

          data = open('DataFile.txt')

          for each_line in data:

           try:                  #保护代码避开运行时的错误

            (role,line_spoken)=each_line.split(':')  #需要缩进

            print(role,end='')           #缩进长度和上面一样

            print(' said: ',end='')

            print(line_spoken,end='')

           except:

            pass               #如果出现一个运行时错误,会执行这个代码

          data.close()

      注:对于列表,用中括号[]扩起来的是可以改变的列表;

        用小括号()扩起来的是不可以改变的列表,可以认为是一个常量列表。

  增加更多错误检查代码

      当数据文件突然丢失或破坏了,那么data=open('DataFile.txt')就会报错,所以有必要对数据文件的存在性进行检查:

        完善后的实例如下:

        方法一:

        import os

        if os.path.exists('DataFile.txt'):

          data = open('DataFile.txt')

          for each_line in data:

           try:                  #保护代码避开运行时的错误

            (role,line_spoken)=each_line.split(':')  #需要缩进

            print(role,end='')           #缩进长度和上面一样

            print(' said: ',end='')

            print(line_spoken,end='')

           except:

            pass               #如果出现一个运行时错误,会执行这个代码

          data.close()

        else:

          print('The data file is misssing!')

        方法二:

        try:                             #保护代码避开运行时的错误

          data = open('DataFile.txt')

          for each_line in data:

            (role,line_spoken)=each_line.split(':')  #需要缩进

            print(role,end='')           #缩进长度和上面一样

            print(' said: ',end='')

            print(line_spoken,end='')

          data.close()

      except:

            print(‘The data file is missing!’)        #文件丢失   

问答:那么经过上面两种方法的实现,哪种方法更好一些呢?

   随着越来越多的错误和异常,第一种方法:增加额外代码和逻辑的复杂度也会随之增加,到后来就会比较乱;

                第二种方法:采用异常处理机制,可以将主要注意力集中于代码的真正功能和实现。

      所以,总的来说,采用异常处理机制这种方式更合适。

进一步的完善:特定指定异常

  通过对except代码指定错误类型,就可以把一般化的异常处理转换为具有特定性的处理,如下:

        try:                             #保护代码避开运行时的错误

          data = open('DataFile.txt')

          for each_line in data:

            try:

            (role,line_spoken)=each_line.split(':')  #需要缩进

            print(role,end='')           #缩进长度和上面一样

            print(' said: ',end='')

            print(line_spoken,end='')

          except ValueError:

            pass

          data.close()

      except IOError:

            print(‘The data file is missing!’)        #文件丢失   

    注:Python中不可改变的常量列表称为元组:tuple,一旦列表数据赋值到一个元组,就不能再改变,元组的符号是小括号(tuple)。

 

------------------------------------------The End of Third Chapter---------------------------------------------

posted @ 2017-09-20 13:03  Blog_WHP  阅读(472)  评论(0编辑  收藏  举报