软工作业3:词频统计

一、案例程序分析

  1.1、编译环境

           pycharm2018

           python3.7

 1.2、读文件到缓冲区(process_file(dst))

1.3、处理缓冲区,返回存有词频数据的字典(process_buffer(bvffer))

1.4、输出词频前十的单词(output_result(word_freq))、

1.5、主函数对之前的函数进行整合(main())

二、代码风格说明

在python中用缩进来取代{ }的功能,tab键在python中一般会缩进4个空格而不是两个,但有的电脑系统因为配置方面不同可能使tab缩进的位数不同,所以尽量使用空格来缩进,例如

三、程序运行命令、运行结果截图 

《飘》 文本文件的词频统计运行截图 

 

四、性能分析结果及改进

  1: 总运行时间

2:执行次数最多的部分代码(截取部分) 

3:执行时间最多的部分代码  

 

改进:
可以选择减少调用次数,这部分调用最多,但是需要遍历整篇文章,不好动。

 

 使用可视化工具分析

 

posted @ 2018-10-09 22:27  名字被占用了!!!  阅读(141)  评论(1)    收藏  举报