hjy13

软工作业2:个人项目

快速了解

这个作业属于哪个课程 前往课程
这个作业要求在哪里 作业要求
这个作业的目标 熟悉个人开发项目的完整流程

1、前言

1.1 github地址

2. 论文程序流程

2.1 分析流程

image-20230917223837314

2.2 程序各个类分析

image-20230918001318712

2.3 算法介绍

通过上网,连接学习相关查重算法,确定了用simhash+海明距离实现论文查重

image-20230917224046622

3、性能分析

image-20230917224209882

image-20230917224249299

4. 模块部分单元测试展示

4.1 SimHash模块的测试

public class SimHashUtilsTest {
    @Test
    public void getHashTest(){
        String[] strings = {"今晚", "的", "月亮", "好圆", "啊"};
        for (String string : strings) {
            String stringHash = SimHashUtils.getHash(string);
            System.out.println(stringHash.length());
            System.out.println(stringHash);
        }
    }
    @Test
    public void getSimHashTest(){
        String str0 = TxtIOUtils.readTxt("D:/test/orig.txt");
        String str1 = TxtIOUtils.readTxt("D:/test/orig_0.8_add.txt");
        System.out.println(SimHashUtils.getSimHash(str0));
        System.out.println(SimHashUtils.getSimHash(str1));
    }
}

  • 测试结果

image-20230917232304335

5. 论文查重程序开发的PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 120 40
.Estimate .估计这个任务需要多少时间 720 480
.Development 开发 100 50
.Analysis .需求分析(包括学习新技术) 60 65
.Design Spec .生成设计文档 40 35
.Design Review .设计复审 30 10
.Coding Standard .代码规范(为当前开发制定合适的规范) 30 30
.Design .具体设计 40 25
.Coding .具体编码 60 45
.Code Review .代码复审 30 20
.Test .测试(自我测试,修改代码,提交修改) 45 40
.Reporting .报告 40 30
.Test Repor .测试报告 35 20
.Size Measurement .计算工作量 30 20
.Postmortem & Process Improvement Plan .事后总结,并提出过程改进计划 45 45
.合计 1420 955

posted on 2023-09-18 00:16  你好的俊峰  阅读(31)  评论(0)    收藏  举报

导航