第一次个人编程作业

一、GitHub链接:https://github.com/linjiazhi147/031802119
二:代码思路:


1.读入文本进行处理,去除标点,jieba分词,其中jieba的内容原理是加载字典, 生成trie树,给定待分词的句子, 使用正则获取连续的 中文字符和英文字符, 切分成 短语列表, 对每个短语使用DAG(查字典)和动态规划, 得到最大概率路径。

2.计算余弦相似度

三、计算机模块接口测试:
文本处理的性能分析:

余弦相似度计算性能分析:

四、计算机模块单元测试:

五、

PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 30 30
Estimate 估计这个任务需要多少时间 10 10
Development 开发 360 400
Analysis 需求分析 (包括学习新技术) 360 400
Design Spec 生成设计文档 60 60
Design Review 设计复审 30 30
Coding Standard 代码规范 (为目前的开发制定合适的规范) 20 20
Design 具体设计 30 30
Coding 具体编码 180 240
Code Review 代码复审 60 10
Test 测试(自我测试,修改代码,提交修改) 120 130
Reporting 报告 30 30
Test Report 测试报告 30 30
Size Measurement 计算工作量 30 30
Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 30 30
合计 1380 1530
posted @ 2020-09-17 22:56  林佳志  阅读(194)  评论(0编辑  收藏  举报