个人项目:论文查重
个人项目:论文查重
| 作业所属课程 | https://edu.cnblogs.com/campus/gdgy/Networkengineering1834 |
|---|---|
| 作业要求 | https://edu.cnblogs.com/campus/gdgy/Networkengineering1834/homework/11146 |
| 作业目标 | 学会使用PSP表格 学会使用工具进行优化和性能分析 |
| GitHub仓库地址:https://github.com/lidalei1/lidalei1 |
一、PSP表格
| PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
|---|---|---|---|
| Planning | 计划 | 30 | 30 |
| · Estimate | 估计这个任务需要多少时间 | 30 | 30 |
| Development | 开发 | 500 | 520 |
| · Analysis | 需求分析 (包括学习新技术) | 150 | 150 |
| · Design Spec | 生成设计文档 | 40 | 30 |
| · Design Review | 设计复审 | 60 | 60 |
| · Coding Standard | 代码规范 (为目前的开发制定合适的规范) | 30 | 20 |
| · Design | 具体设计 | 90 | 80 |
| · Coding | 具体编码 | 300 | 300 |
| · Code Review | 代码复审 | 60 | 60 |
| · Test | 测试(自我测试,修改代码,提交修改) | 50 | 60 |
| Reporting | 报告 | 60 | 70 |
| ·Test Report | 测试报告 | 20 | 20 |
| ·Size Measurement | 计算工作量 | 10 | 10 |
| ·Postmortem & Process Improvement Plan | 事后总结, 并提出过程改进计划 | 20 | 20 |
| Total | 合计 | 1450 | 1460 |
二、设计过程

核心算法描述:
将被检测的语句与已有语句进行重复率检测,使用KMP算法得出两个语句中最长公共子字符串,并以此计算该语句的重复率,字符与已有语句中字符使用二维矩阵计算两字符集合的交集,并以此得出被检测语句重复率。语句重复率取字符重复率和语句重复率的均值,文本重复率等于语句重复率的总和除以语句数。
文本处理

重复率计算

路径读入

输出结果写入文本

三、单元测试
文件读取测试

文件写入测试

异常测试

四、性能分析







浙公网安备 33010602011771号