第一次个人编程作业

这个作业属于哪个课程 https://edu.cnblogs.com/campus/gdgy/Networkengineering1834
这个作业要求在哪里 https://edu.cnblogs.com/campus/gdgy/Networkengineering1834/homework/11146
这个作业的目标 学会Java下同时读取多个本地txt文本并存储到缓冲池,等待之后的查重操操作
学会一种查重方法,矩阵查重算法
学会分解长文本为短文本查重,减小内存占用,加快运行速度

1.github地址

/*******************************************/

2.PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟
Planning 计划 20 30
·Estimate 估计这个任务需要多少时间 20 30
Development 开发 350 400
· Analysis 需求分析 (包括学习新技术 150 180
· Design Spec 生成设计文档 10 30
· Design Review 设计复审 10 20
· Coding Standard 代码规范 (为目前的开发制定合适的规范) 10 65
· Design 具体设计 30 60
· Coding 具体编码 300 350
· Code Review 代码复审 10 20
· Test 测试 30 60
Reporting 报告 20 30
· Test Report 测试报告 10 5
· Size Measurement 计算工作量 10 5
· Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 10 20
· 合计 990 1125

3.项目内容:

(1.结构)

(2.实现思路)

  1.文本查重,可以同时全部导入两个文本进行查重,也可以逐句查重。但前者由于文本数量大,运行起来占用内存高,后者代码量大,需要判断标点符号。这里采用按行进行查重,算是折中做法。
  2.查重原理采用矩阵查重算法,计算编辑距离的方法是把两个String串里的字/词当成一个矩阵来比较和计算。

(3.性能分析)



(4.测试结果)

  1.对于第一份文本


2.对于第二份文本

3.对于第三份文本

(5.总结)

这次项目,耗时远超预计计划,对项目难度,自身能力还存在很大的估计错误。项目和自己本身能力存在很大差距,很难短时间弥补自身短板。

之后打算把时间重新分类,课下时间除了体育锻炼不变,分配较多时间给软工项目和Java学习上,对于自己打算专攻网络方向的计划放慢。暂且按上述方法行动一个月,后续再灵活调整。

posted @ 2020-09-24 23:28  dgd-for-true  阅读(181)  评论(0编辑  收藏  举报