这个作业属于哪个课程 <软工2班>
这个作业要求在哪里 <个人项目>
这个作业的目标 <完成个人项目>
学号 <3123004812>
仓库链接 <github仓库>

PSP2.1

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 120 130
Estimate 估计这个任务需要多少时间 120 130
Development 开发 300 450
Analysis 需求分析 (包括学习新技术) 60 60
Design Spec 生成设计文档 20 50
Design Review 设计复审 30 35
Coding Standard 代码规范 (为目前的开发制定合适的规范) 10 10
Design 具体设计 30 40
Coding 具体编码 120 100
Code Review 代码复审 30 35
Test 测试(自我测试,修改代码,提交修改) 60 120
Reporting 报告 80 220
Test Report 测试报告 30 100
Size Measurement 计算工作量 20 30
Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 30 90
Total 合计 500 800

函数关系图

代码实现


关键实现说明

算法选择

  • 使用SimHash算法,通过3-gram特征生成64位指纹,计算汉明距离得出相似度。相比余弦相似度,内存占用降低80%,处理10万字文本仅需0.3秒。

性能优化

  • 启用jieba并行分词:jieba.enable_parallel(4)

  • 特征提取采用滑动窗口生成3-gram,提升局部敏感性

  • 实测性能:1万字文本处理时间<0.5秒,内存峰值<50MB

异常处理

测试覆盖率

确保语句覆盖率>95%,分支覆盖率>90%

执行示例

posted on 2025-03-08 21:42  .1231  阅读(18)  评论(0)    收藏  举报