WordCount
| 这个作业属于哪个课程 | https://edu.cnblogs.com/campus/nue/SE202010 |
| 这个作业要求在哪里 | https://edu.cnblogs.com/campus/nue/SE202010/homework/11481 |
| 这个作业的目标 | 实现一个能够对文本文件中的单词的词频进行统计的控制台程序 |
| 学号 | 2001007 |
1、代码仓库链接:https://gitee.com/elaine0507/PycharmFiles.git 程序文件名为work1118_2.py
2、PSP表格。
| PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
|---|---|---|---|
| Planning | 计划 | 30 | 15 |
| · Estimate | · 估计这个任务需要多少时间 | 300 | 350 |
| Development | 开发 | 260 | 400 |
| · Analysis | · 需求分析 (包括学习新技术) | 20 | 20 |
| · Design Spec | · 生成设计文档 | 10 | 10 |
| · Design Review | · 设计复审 | 5 | 5 |
| · Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | 5 | 5 |
| · Design | · 具体设计 | 50 | 100 |
| · Coding | · 具体编码 | 100 | 200 |
| · Code Review | · 代码复审 | 30 | 60 |
| · Test | · 测试(自我测试,修改代码,提交修改) | 40 | 25 |
| Reporting | 报告 | 40 | 40 |
| · Test Repor | · 测试报告 | 15 | 20 |
| · Size Measurement | · 计算工作量 | 5 | 5 |
| · Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 20 | 15 |
| 合计 | 330 | 455 |
3、计算模块接口的设计与实现过程。

程序代码:





运行结果:输出最高词频的前十个单词;行数8203;字符数分类统计;输出所有单词频数。

![]()


4、计算模块接口部分的性能改进。


函数中AllWordCount函数所用时间最长, 353ms。改进可能需要后续再思考完善。
5、学习日志
| 学习时段 | 11.12(1900-2045) |
11.13(1850-2020) |
11.15(1850-2000) | 11.16(1850-2030) | 11.17(1850-2050) | 11.18(1900-2050) |
| 学习内容 | 学习函数,在网上搜索代码 | 列表、字典与集合 | Lambda函数,网上查资料 | WordCount作业设计与查资料 | WordCount作业编程与撰写博客 | WordCount作业调试与撰写博客 |
| 收获体会 | Python知识得到积累 | Python知识得到积累 | Python知识得到积累 | 作业起步 | 部分代码还需调试,模块化还需进一步分析 | 完成作业 |
| 自我效率评价 | 低,比较盲目 | 高 | 中 | 低 | 高 | 高 |

浙公网安备 33010602011771号