一、编码要求
GitHub链接:[https://github.com/wjx0110/031802232]:
二、计算模块接口的设计与实现过程
1、流程图

2、代码的读取:刚开始不懂应该怎么写,从网上看了许多大佬的代码,又去学了python的一些基础知识,但也只是一些皮毛,最终在众多的代码中选择了余弦的相似度的计算。(OS:这也太难了吧!!!)
附上大佬的博客:https://blog.csdn.net/kobeyu652453/article/details/106397319/ https://www.cnblogs.com/zuixime0515/p/9206861.html
3、代码的实现:
def words2vec(words1=None, words2=None):
v1 = []
v2 = []
tag1 = jieba.analyse.extract_tags(words1, withWeight=True)
tag2 = jieba.analyse.extract_tags(words2, withWeight=True)
tag_dict1 = {i[0]: i[1] for i in tag1}
tag_dict2 = {i[0]: i[1] for i in tag2}
merged_tag = set(tag_dict1.keys()) | set(tag_dict2.keys())
for i in merged_tag:
if i in tag_dict1:
v1.append(tag_dict1[i])
else:
v1.append(0)
if i in tag_dict2:
v2.append(tag_dict2[i])
else:
v2.append(0)
return v1, v2
def cosine_similarity(vector1, vector2):
dot_product = 0.0
normA = 0.0
normB = 0.0
for a, b in zip(vector1, vector2):
dot_product += a * b
normA += a ** 2
normB += b ** 2
if normA == 0.0 or normB == 0.0:
return 0
else:
return round(dot_product / ((normA ** 0.5) * (normB ** 0.5)) , 2)
def cosine(str1, str2):
vec1, vec2 = words2vec(str1, str2)
return cosine_similarity(vec1, vec2)
4、单元测试的示例
D:\project\sim_0.8\orig.txt
D:\project\sim_0.8\orig_0.8_add.txt
similarity=0.94
D:\project\sim_0.8\orig.txt
D:\project\sim_0.8\orig_0.8_del.txt
similarity=0.93
D:\project\sim_0.8\orig.txt
D:\project\sim_0.8\orig_0.8_dis_1.txt
similarity=0.99
D:\project\sim_0.8\orig.txt
D:\project\sim_0.8\orig_0.8_dis_3.txt
similarity=0.96
D:\project\sim_0.8\orig.txt
D:\project\sim_0.8\orig_0.8_dis_7.txt
similarity=0.96
D:\project\sim_0.8\orig.txt
D:\project\sim_0.8\orig_0.8_dis_15.txt
similarity=0.91
D:\project\sim_0.8\orig.txt
D:\project\sim_0.8\orig_0.8_dis_10.txt
similarity=0.95
D:\project\sim_0.8\orig.txt
D:\project\sim_0.8\orig_0.8_mix.txt
similarity=0.94
D:\project\sim_0.8\orig.txt
D:\project\sim_0.8\orig_0.8_rep.txt
similarity=0.95
三、性能分析图
(利用pycharm的profile)

四、PSP表格
| PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
|---|---|---|---|
| · Planning | · 计划 | 20 | 20 |
| · Estimate | · 估计这个任务需要多少时间 | 30 | 30 |
| · Development | · 开发 | 110 | 130 |
| · Analysis | · 需求分析 (包括学习新技术) | 1200 | 1300 |
| · Design Spec | · 生成设计文档 | 30 | 30 |
| · Design Review | · 设计复审 | 30 | 30 |
| · Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | 50 | 50 |
| · Design | · 具体设计 | 300 | 320 |
| · Coding | · 具体编码 | 360 | 400 |
| · Code Review | · 代码复审 | 50 | 80 |
| · Test | · 测试(自我测试,修改代码,提交修改 | 140 | 160 |
| · Reporting | · 报告 | 30 | 30 |
| · Test Repor | · 测试报告 | 30 | 30 |
| · Size Measurement | · 计算工作量 | 15 | 20 |
| · Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 70 | 70 |
| · 合计 | 2465 | 2700 |
五、个人总结
1、通过这次实践作业,我认识到了自己的不足,在计算机语言学习方面还要继续努力(ps:软工实践的作业好难啊!!,看着大佬们一个接一个的交作业,而我还在不停的开网页学习,还没有什么思路,在崩溃的边缘疯狂试探)
2、终于搞定了作业,在软工作业的推动下,我还去学习了一些python的知识(虽然只是一些皮毛,只能跟着大佬的步伐)。
3、软工虽难,但还是要继续努力学习鸭!(菜鸡真的很想哭😭)
浙公网安备 33010602011771号