作业2

这个作业属于哪个课程 作业课程
这个作业要求在哪里 作业要求
这个作业的目标 学习个人开发查重项目

我的github:github仓库

一.PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 30 30
Estimate 估计这个任务需要多少时间 100 180
Development 开发 180 200
Analysis 需求分析 (包括学习新技术) 80 80
Design Spec 生成设计文档 20 20
Design Review 设计复审 40 30
Coding Standard 代码规范 (为目前的开发制定合适的规范) 25 20
Design 具体设计 40 40
Coding 具体编码 70 70
Code Review 代码复审 30 40
Test 测试(自我测试,修改代码,提交修改) 30 30
Reporting 报告 20 20
Test Repor 测试报告 20 10
Size Measurement 计算工作量 10 20
Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 30 30
合计 725 840

二.接口模块说明

1.read_file:读取文件内容并返回字符串

2.tokenize:将文本分词,存储到二维数组中。

3.compute_word_freq:计算每个词的频率,并生成词频向量。

4.cosine_similarity:计算两个词频向量的余弦相似度。

5.main:主函数,处理命令行参数,调用上述函数并输出结果。

posted @ 2025-03-08 21:33  gzslm  阅读(17)  评论(0)    收藏  举报