个人项目:论文查重

我的 GitHub

写在前面

这个作业属于哪个课程 https://edu.cnblogs.com/campus/gdgy/Networkengineering1834
这个作业要求在哪里 https://edu.cnblogs.com/campus/gdgy/Networkengineering1834/homework/11146
这个作业的目标 学习使用PSP表格、学习commit规范、学习算法、学习测试规范

一、PSP 表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 30 60
· Estimate · 估计这个任务需要多少时间 60 50
Development 开发 340 460
· Analysis · 需求分析 (包括学习新技术) 160 190
· Design Spec · 生成设计文档 0 0
· Design Review · 设计复审 0 0
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 0 0
· Design · 具体设计 30 30
· Coding · 具体编码 200 270
· Code Review · 代码复审 60 60
· Test · 测试(自我测试,修改代码,提交修改) 60 80
Reporting 报告 30 60
· Test Repor · 测试报告 30 30
· Size Measurement · 计算工作量 20 20
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 30 30
· 合计 1050 1340

二、接口的设计与实现过程

1.算法原理

参考文章

可以利用余弦相似度算法的原因:如果这两句话的用词越相似,它们的内容就应该越相似。

2.接口设计

2.1 文件读取类

该接口负责读取指定路径的文档文件

2.2 分词算法及余弦相似度计算

该接口负责将导入的数据进行处理,使用分词器后运用余弦相似度算法计算两个文档的相似度

3.程序流程

三、模块接口部分的性能改进

1.使用SonarLint改进代码质量

2.使用JProfier分析性能

四、单元测试展示

1.测试覆盖率

2.单元测试

五、异常处理


posted @ 2020-09-25 02:09  Krump2020  阅读(129)  评论(0)    收藏  举报