作业二
作业介绍
| 这个作业属于哪个课程 | 软件工程 https://edu.cnblogs.com/campus/gdgy/SoftwareEngineeringClassof2023 | |
|---|---|---|
| 这个作业要求在哪里 | https://edu.cnblogs.com/campus/gdgy/SoftwareEngineeringClassof2023/homework/13324 | |
| 这个作业的目标 | 文本查重并测试,性能分析 | |
| github | https://github.com/Christina602/3123004788/blob/main/README.md |
psp
| PSP | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
|---|---|---|---|
| Planning | 计划 | 120 | 140 |
| · Estimate | 估计这个任务需要多少时间 | 120 | 140 |
| Development | 开发 | 300 | 455 |
| · Analysis | 需求分析 (包括学习新技术) | 60 | 60 |
| · Design Spec | 生成设计文档 | 20 | 45 |
| · Design Review | 设计复审 | 30 | 30 |
| · Coding Standard | 代码规范 (为目前的开发制定合适的规范) | 10 | 10 |
| · Design | 具体设计 | 30 | 30 |
| · Coding | 具体编码 | 120 | 90 |
| · Code Review | 代码复审 | 30 | 40 |
| · Test | 测试(自我测试,修改代码,提交修改) | 60 | 150 |
| Reporting | 报告 | 80 | 285 |
| · Test Report | 测试报告 | 30 | 120 |
| · Size Measurement | 计算工作量 | 20 | 40 |
| · Postmortem & Process Improvement Plan | 事后总结, 并提出过程改进计划 | 30 | 125 |
| Total | 合计 | 500(8小时) | 880(13小时) |
开发环境
语言:java 14
工具:IDEA 2020
系统:Windows 11
calculateSimilarity 方法:


使用简单的字符匹配算法计算两个文本的相似度。
返回一个 0 到 1 之间的浮点数,表示重复率。
可以替换为更复杂的算法(如余弦相似度、Jaccard 相似度等)。
main 方法:
从命令行参数获取原文文件、抄袭版文件和输出文件的路径。
读取原文文件和抄袭版文件的内容。
调用 calculateSimilarity 方法计算重复率。
将结果保存到输出文件中,精确到小数点后两位。
异常处理:
如果文件未找到,会捕获 FileNotFoundException 并提示用户检查路径。
如果发生其他错误,会捕获 IOException 并输出错误信息。
浙公网安备 33010602011771号