词频统计

1) 自己的基本信息:

  • 学号:2017*****1054;
  • 姓名:杨玉婷
  • 码云仓库地址:https://gitee.com/yyyt1/word_frequency_count.git
  • 用命令python -m cProfile word_freq.py Gone_with_the_wind.txt运行:
  •  

    执行次数最多的代码:349/次

    执行时间最长的代码:0.001


     

    应改把执行时间最长的代码优化一下,函数process_buffer函数中有一行代码:

    if word in word_freq.keys():

    代码在for循环中,有多少单词,这个循环就会执行多少遍,每次进行条件判断的时候都要执行一次字典的keys方法,所以耗时很多。于是把keys去除,代码变为:

    if word in word_freq:

  •  

posted @ 2019-04-04 10:48  杨玉婷  阅读(168)  评论(1编辑  收藏  举报