词友星球事后诸葛亮分析报告
| 这个作业属于哪个课程 | 计科23级12班 |
|---|---|
| 这个作业要求在哪里 | 团队作业6——复审与事后分析 |
| 会议照片由于人数问题就没放了,抱歉 | |
| 一、设想与目标 |
- 核心问题定义清晰
积极方面:
核心目标明确:本项目致力于构建一个面向本地文档的“第二大脑”式智能问答系统,实现高效知识检索与语义理解。
用户角色明确:系统支持四类用户,包括政策解读用户、企业法务人员、普通用户与管理员,场景覆盖全面。
问题聚焦准确:针对文档碎片化、关键词检索效率低、问答系统无上下文记忆等痛点进行了明确回应。
2. 目标达成情况良好
核心功能实现完整:知识库管理(CRUD)、PDF解析、RAG问答流程、流式输出与Prompt配置功能均已实现。
扩展功能有效支撑:会话记忆模块、图片内容理解与用户反馈机制等已投入使用。
调整合理:RBAC权限管理因架构复杂度延后至Beta阶段优化。
交付稳定:全周期27天,符合原始计划,无延期;关键里程碑均如期交付。### 3. 软件质量稳步提升- 代码复用率:服务层复用率由30%提升至65%,降低冗余。
文档完整性:文档覆盖部署指南、API说明及数据库设计等,整体覆盖率达85%。
测试覆盖率:关键API模块测试覆盖率为72%,符合预期。
4. 用户反馈与项目目标吻合
Alpha测试数据(32名用户):- 满意度评分:核心问答功能得分4.2 / 5。
主要建议:PDF解析准确度仍有提升空间,界面交互流程建议优化。
认可度:90%用户表示系统大幅提升了文档查阅效率。
二、计划执行情况
- 原计划时间评估合理
充足部分:
需求分析:3天,高效完成;
文档撰写:2天,进度可控。
紧张部分: -Milvus索引调优延迟2天;
前端流式展示因状态管理复杂推迟1天。 - 各类任务完成情况
任务类型 计划数 完成数 完成率 原因分析
核心功能 8 8 100% 优先级明确,聚焦核心
扩展功能 5 4 80% RBAC延迟
优化任务 6 5 83% 部分性能优化时间不足 - 交付件定义清晰
API接口文档:结构清晰,定义标准。
数据库设计:含ER图与字段说明。
核心算法说明:包括RAG流程伪代码及应用示例。 - 计划执行中的风险及应对
风险1:Milvus版本不一致
问题:本地2.3.0与Docker 2.4.0存在API差异;
解决:统一使用Docker部署,并增加版本检测脚本。
风险2:嵌入模型显存问题
问题:all-MiniLM-L6-v2模型在8GB内存机器上无法加载;
解决:增加内存检查逻辑,并提供轻量级模型备选项。 - 未来计划调整方向
每项技术引入前预留0.5-1天调研;
每3天进行一次滚动回顾与计划调整;
总体预留15%风险缓冲。
三、资源情况 - 资源评估- 充足资源:黄思聪具备Python开发基础,开发环境与工具完善(Git、Docker、Markdown、Swagger等)。
稀缺资源:缺乏大规模真实政策类PDF文档作为测试数据。 - 时间评估准确度
API与数据库开发任务误差均在±0.5天范围;
低估项:
PDF解析优化:从预估2天增长至3.5天;
流式展示前端调试耗时翻倍(兼容性问题)。 - 非编程资源配置- 测试人员:单人兼任测试角色,基本满足当前需求,但自动化能力需提升。
UI设计与文档:时间低估2–3天,后期通过迭代补齐。 - 效率提升空间
初期代码审查缺乏规范 → 后期引入checklist,效率提升40%;
环境配置由手动转为Docker镜像共享,时间节省70%;
会议由自由讨论转为模板化,会议时长缩减30%。
四、设计与实现
1. 模糊设计问题解决策略
向量检索阈值:
通过100组测试问答确定最优阈值为0.75;
方法:A/B测试结合人工标注。
会话记忆策略:
采用滑动窗口(保留最近10轮)+ 时间戳清理机制。
2. 工具与实践一致性
UML建模:PlantUML;
单元测试:pytest+覆盖率统计;
部分模块采用TDD。
3. 代码规范与复审执行- 规范流程:PR提交 → 自动检查(flake8/mypy)→ 双人复审 → 合并;
复审覆盖率:核心模块100%,平均时间15–30分钟;
规范执行率:由初期60%提升至90%。
五、测试与发布
- 测试计划制定情况
覆盖核心模块;
明确分工;
性能测试场景仍待补充。 - 验收测试情况
内部测试:交叉测试覆盖核心流程;
外部测试:32人参与,收集127条反馈,GitHub闭环率92%。 - 测试工具与改进计划
当前工具:
后端API:pytest + coverage;
API接口测试:httpx;
前端:人工测试;
性能测试:locust。
未来改进:
引入Playwright进行前端自动化;
建立性能基线及监控指标。 - 软件效能数据
平均响应时间:非流式3.2s,流式首字节1.1s;
并发能力:支持20并发,响应均在5s内;
PDF处理峰值内存:2.1GB;
压测发现Milvus连接池耗尽问题,已通过参数优化解决。 - 发布问题与解决
Docker构建失败:依赖版本冲突,已切换为Pipenv管理;
Safari兼容性问题:采用浏览器识别降级策略规避异常。
六、成员贡献(Alpha阶段)
姓名 角色 主要贡献
黄思聪 全栈开发者 独立完成需求分析、架构设计、核心功能编码、前端展示、PDF解析与部署流程。
贡献评分依据:
技术复杂度:40%
工作完成度:30%
文档与质量:20%
协作与自我反馈:10%
七、阶段关键数据统计
指标类别 具体指标 Alpha目标 实际达成 完成率
功能完成 核心功能数 8 8 100%
扩展功能数 5 4 80%
时间管理 总工期 27天 27天 100%
质量指标 Bug总数 ≤15 7 -
用户反馈 满意度评分 ≥4.0/5 4.2/5 105%
团队效能 任务完成率 ≥85% 88% 104%
八、Beta阶段改进重点
技术债务清理(高):- 重构PDF解析逻辑;
优化内存管理,防止内存泄漏。
测试体系建立(高):
推动自动化测试覆盖核心API;
建立稳定性能测试基线。
用户体验优化(中高):
简化首次配置流程;
支持批量导入、批量操作功能。
过程改进(中):
建立可复用流程资产库;
明确需求变更记录与跟踪机制。

浙公网安备 33010602011771号