个人项目:论文查重

一、作业链接

链接:github链接

二、PSP表格

个人开发流程 预计耗时 实际耗时
计划 60 5
估计这个任务需要多少时间 30 15
开发 600
需求分析(包括学习新技术) 60
生成设计文档 30
设计复审 60
代码规范(为目前的开发制定合适的规范) 30
具体设计 60
具体编码 600
代码复审 200
测试(自我测试、修改代码、提交修改) 120
报告 60
测试报告 30
计算工作量 40
事后总结,并提出过程改进计划 40
合计 2020

三、计划

1. 论文查重算法的原理以及要如何设计

· 论文查重原理:

将上传的论文与查重系统的数据库资源进行对比检测,如果论文中存在跟数据库类似或者相同的句子,一般以13个字符为标准,严格的有6-7个字符,查重系统就会标记出来,并计算重复率。论文查重系统才用的是多级对比算法,句子一般是最小的对比单位,还有段落,全文等多级对比

· 多级对比算法

  1. 编写代码时可能会用到哪些知识点
  2. 根据1、2制定学习知识点的计划
  3. 代码编写完成后查看是否有语法词义上的错误
  4. 进行代码测试并修改代码
  5. 编写报告
posted @ 2023-09-20 22:17  shuiyin  阅读(66)  评论(0)    收藏  举报