第一次个人编程作业
| 这个作业属于哪个课程 | https://edu.cnblogs.com/campus/gdgy/SoftwareEngineering2024 |
|---|---|
| 这个作业要求在哪里 | https://edu.cnblogs.com/campus/gdgy/SoftwareEngineering2024/homework/13136 |
| 这个作业的目标 | 体验个人软件开发流程 |
1.Gitcode链接
2.PSP
| Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
|---|---|---|
| 计划 | 5 | 5 |
| 估计这个任务需要多少时间 | 410 | 410 |
| 开发 | 120 | 120 |
| 需求分析 (包括学习新技术) | 60 | 160 |
| 生成设计文档 | 30 | 20 |
| 设计复审 | 10 | 10 |
| 代码规范 (为目前的开发制定合适的规范) | 10 | 40 |
| 具体设计 | 20 | 10 |
| 具体编码 | 180 | 60 |
| 代码复审 | 20 | 10 |
| 测试(自我测试,修改代码,提交修改) | 60 | 77 |
| 报告 | 30 | 30 |
| 测试报告 | 10 | 30 |
| 计算工作量 | 10 | 20 |
| 事后总结, 并提出过程改进计划 | 30 | 10 |
| 合计 | 410 | 597 |
3.设计文档
- 文件输入输出模块
类:FileUtils
属性:InFilename1、InFilename2、OutFilename
方法:read、write
- SimHash算法模块
类: SimHash
属性: token、intSimHash、strSimHash、hashbits
方法: simHash:产生文本海明hash;clean:清除特殊字符;hash产生字符的hash;getDistance:计算海明距离;getSemblance:计算重复率
- CmdArgsUtils(main)模块
类:CmdArgsUtils
接受命令,打通接口
3.性能分析

调用次数最多的是com.hankcs.hanlp包提供的接口, 即分词、取关键词与计算词频花费了最多的时间。
4.单元测试



浙公网安备 33010602011771号