作业二

作业介绍

这个作业属于哪个课程 软件工程 https://edu.cnblogs.com/campus/gdgy/SoftwareEngineeringClassof2023
这个作业要求在哪里 https://edu.cnblogs.com/campus/gdgy/SoftwareEngineeringClassof2023/homework/13324
这个作业的目标 文本查重并测试,性能分析
github https://github.com/Christina602/3123004788/blob/main/README.md

psp

PSP Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 120 140
· Estimate 估计这个任务需要多少时间 120 140
Development 开发 300 455
· Analysis 需求分析 (包括学习新技术) 60 60
· Design Spec 生成设计文档 20 45
· Design Review 设计复审 30 30
· Coding Standard 代码规范 (为目前的开发制定合适的规范) 10 10
· Design 具体设计 30 30
· Coding 具体编码 120 90
· Code Review 代码复审 30 40
· Test 测试(自我测试,修改代码,提交修改) 60 150
Reporting 报告 80 285
· Test Report 测试报告 30 120
· Size Measurement 计算工作量 20 40
· Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 30 125
Total 合计 500(8小时) 880(13小时)

开发环境

语言:java 14
工具:IDEA 2020
系统:Windows 11
calculateSimilarity 方法:

使用简单的字符匹配算法计算两个文本的相似度。

返回一个 0 到 1 之间的浮点数,表示重复率。

可以替换为更复杂的算法(如余弦相似度、Jaccard 相似度等)。

main 方法:

从命令行参数获取原文文件、抄袭版文件和输出文件的路径。

读取原文文件和抄袭版文件的内容。

调用 calculateSimilarity 方法计算重复率。

将结果保存到输出文件中,精确到小数点后两位。

异常处理:

如果文件未找到,会捕获 FileNotFoundException 并提示用户检查路径。

如果发生其他错误,会捕获 IOException 并输出错误信息。

posted @ 2025-03-09 00:59  康经腾  阅读(92)  评论(0)    收藏  举报