个人项目:论文查重

个人项目:论文查重

作业所属课程 https://edu.cnblogs.com/campus/gdgy/Networkengineering1834
作业要求 https://edu.cnblogs.com/campus/gdgy/Networkengineering1834/homework/11146
作业目标 学会使用PSP表格 学会使用工具进行优化和性能分析
GitHub仓库地址:https://github.com/lidalei1/lidalei1

一、PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 30 30
· Estimate 估计这个任务需要多少时间 30 30
Development 开发 500 520
· Analysis 需求分析 (包括学习新技术) 150 150
· Design Spec 生成设计文档 40 30
· Design Review 设计复审 60 60
· Coding Standard 代码规范 (为目前的开发制定合适的规范) 30 20
· Design 具体设计 90 80
· Coding 具体编码 300 300
· Code Review 代码复审 60 60
· Test 测试(自我测试,修改代码,提交修改) 50 60
Reporting 报告 60 70
·Test Report 测试报告 20 20
·Size Measurement 计算工作量 10 10
·Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 20 20
Total 合计 1450 1460

二、设计过程

核心算法描述:

将被检测的语句与已有语句进行重复率检测,使用KMP算法得出两个语句中最长公共子字符串,并以此计算该语句的重复率,字符与已有语句中字符使用二维矩阵计算两字符集合的交集,并以此得出被检测语句重复率。语句重复率取字符重复率和语句重复率的均值,文本重复率等于语句重复率的总和除以语句数。

文本处理

重复率计算

路径读入

输出结果写入文本

三、单元测试

文件读取测试

文件写入测试

异常测试

四、性能分析

posted @ 2020-09-24 21:58  蛹火  阅读(127)  评论(0)    收藏  举报