第一次个人编程作业

作业的Github地址 Github地址
这个作业属于哪个课程 网工1934-软件工程
这个作业要求是什么 作业要求

一、PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 25 20
· Estimate · 估计这个任务需要多少时间 25 20
Development 开发 1695 1395
· Analysis · 需求分析 (包括学习新技术) 600 630
· Design Spec · 生成设计文档 30 20
· Design Review · 设计复审 20 15
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 15 10
· Design · 具体设计 25 30
· Coding · 具体编码 600 380
· Code Review · 代码复审 40 30
· Test · 测试(自我测试,修改代码,提交修改) 200 150
Reporting 报告 60 50
· Test Repor · 测试报告 55 40
· Size Measurement · 计算工作量 20 15
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 30 25
· 合计 1710 1415

二、模块接口的设计与实现过程

1、依赖包

HanLP自然语言处理包

2、项目结构

Main:项目入口
Hamming类:计算Hamming距离和相似度
IOtext类:读写文件
SimHash类:计算hash值和SimHash值

3、算法流程图

SimHash算法介绍

分词、获取hash值、加权、合并

降维

三、性能分析

内存


消耗最大的函数是int[]、HanLP分词包

四、部分单元测试展示

1、获取Hamming距离


2、获取相似度


3、读取时路径错误


4、读取文件名


5、单元测试覆盖率


五、模块部分异常处理

六、功能展示



posted @ 2021-09-19 15:12  Hysty  阅读(81)  评论(0)    收藏  举报