第一次编程作业
一、PSP表格
| PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
|---|---|---|---|
| Planning | 计划 | 20 | 10 |
| · Estimate | · 估计这个任务需要多少时间 | 20 | 10 |
| Development | 开发 | 970 | 1135 |
| · Analysis | · 需求分析 (包括学习新技术) | 120 | 180 |
| · Design Spec | · 生成设计文档 | 10 | 15 |
| · Design Review | · 设计复审 | 20 | 20 |
| · Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | 50 | 50 |
| · Design | · 具体设计 | 300 | 420 |
| · Coding | · 具体编码 | 600 | 720 |
| · Code Review | · 代码复审 | 50 | 60 |
| · Test | · 测试(自我测试,修改代码,提交修改) | 20 | 30 |
| Reporting | 报告 | 90 | 160 |
| · Test Repor | · 测试报告 | 20 | 30 |
| · Size Measurement | · 计算工作量 | 10 | 10 |
| · Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 60 | 120 |
| · 合计 | 1080 | 1265 |
二、计算模块接口
(3.1)计算模块接口的设计与实现过程。设计包括代码如何组织,比如会有几个类,几个函数,他们之间关系如何,关键函数是否需要画出流程图?说明你的算法的关键(不必列出源代码),以及独到之处。(18')
Chaizi类负责把单个汉字拆开
copyRegex类负责正则表达式
AhocorasickCopy类负责AC自动机,进行字符串匹配
BlackList类获取文本中敏感词到黑名单中敏感词的映射
Copycat类负责把所有的类整合到一起
算法:AC自动机和正则表达式。
这道题出来就想到了AC自动机进行匹配,但是AC自动机完成这个似乎不是很够,就想能不能把匹配出来的词作为一个新的敏感词进行匹配。
(3.2)计算模块接口部分的性能改进。记录在改进计算模块性能上所花费的时间,描述你改进的思路,并展示一张性能分析图(由VS 2019、JProfiler或者Jetbrains系列IDE自带的Profiler的性能分析工具自动生成),并展示你程序中消耗最大的函数。(12')
调试了很久也只是这个结果。。。

(3.3)计算模块部分单元测试展示。展示出项目部分单元测试代码,并说明测试的函数,构造测试数据的思路。并将单元测试得到的测试覆盖率截图,发表在博客中。(12')
单元测试也是完全调不出来,或许又要重新装一次环境。。。
(3.4)计算模块部分异常处理说明。在博客中详细介绍每种异常的设计目标。每种异常都要选择一个单元测试样例发布在博客中,并指明错误对应的场景。(6')
如果没有文件读入的话,就输出文件错误。

三、心得
这次作业真的是从零开始学python。从各种语句和语法到库和环境的安装,再到换编译器。即使到现在,也有很多不明白的地方,代码也是东拼西凑拼起来的。为了安装一个ahocorasick库就花了我两个晚上的时间,还不包括去了解库和用法。我感觉挺无助的,也不好意思去问别人怎么做,就只能自己找视频学。真的是什么都不明白,说不定下次回去用c++写会更好吧。。。不过一回生二回熟,后面的作业可能会更顺一点吧。。。。

浙公网安备 33010602011771号