论文查重
| 这个作业属于哪个课程 | https://edu.cnblogs.com/campus/gdgy/CSGrade22-34 |
|---|---|
| 这个作业要求在哪里 | https://edu.cnblogs.com/campus/gdgy/CSGrade22-34/homework/13229 |
| 这个作业的目标 | 完成个人项目论文查重系统,熟悉psp,测试,性能分析,异常处理等内容。 |
1、仓库地址
https://github.com/ybb-ybbbb/3122006324.git

2、PSP表格记录
| PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
|---|---|---|---|
| Planning | 计划 | 35 | 35 |
| - Estimate | - 估计这个任务需要多少时间 | 35 | 35 |
| Development | 开发 | 375 | 390 |
| - Design Spec | - 需求分析 (包括学习新技术) | 50 | 90 |
| - Design Review | - 生成设计文档 | 40 | 30 |
| - Coding Standard | - 设计复审 | 35 | 20 |
| - Design | - 具体设计 | 50 | 45 |
| - Coding | - 具体编码 | 80 | 75 |
| - Code Review | - 代码复审 | 30 | 35 |
| - Test | - 测试(自我测试,修改代码,提交修改) | 90 | 80 |
| Reporting | 报告 | 180 | 230 |
| - Test Repor | - 测试报告 | 70 | 130 |
| - Size Measurement | - 计算工作量 | 60 | 70 |
| - Postmortem & Process Improvement Plan | - 事后总结, 并提出过程改进计划 | 50 | 30 |
| All | 合计 | 590 | 655 |
3、测试用例

原文

抄袭文章

4.计算模块接口的设计与实现过程
1)对中文文本进行处理
def remove_punctuation /def tokenize_and_remove_punctuation /def concatenate_words

2)计算相似度
def calculate_similarity

5.单元测试
代码:

6.性能测试
代码

以老师给的测试文本为例

7.输出结果


浙公网安备 33010602011771号