词友星球事后诸葛亮分析报告

这个作业属于哪个课程 计科23级12班
这个作业要求在哪里 团队作业6——复审与事后分析
会议照片由于人数问题就没放了,抱歉
一、设想与目标
  1. 核心问题定义清晰
    积极方面:

核心目标明确:本项目致力于构建一个面向本地文档的“第二大脑”式智能问答系统,实现高效知识检索与语义理解。
用户角色明确:系统支持四类用户,包括政策解读用户、企业法务人员、普通用户与管理员,场景覆盖全面。
问题聚焦准确:针对文档碎片化、关键词检索效率低、问答系统无上下文记忆等痛点进行了明确回应。
2. 目标达成情况良好
核心功能实现完整:知识库管理(CRUD)、PDF解析、RAG问答流程、流式输出与Prompt配置功能均已实现。
扩展功能有效支撑:会话记忆模块、图片内容理解与用户反馈机制等已投入使用。
调整合理:RBAC权限管理因架构复杂度延后至Beta阶段优化。
交付稳定:全周期27天,符合原始计划,无延期;关键里程碑均如期交付。### 3. 软件质量稳步提升- 代码复用率:服务层复用率由30%提升至65%,降低冗余。
文档完整性:文档覆盖部署指南、API说明及数据库设计等,整体覆盖率达85%。
测试覆盖率:关键API模块测试覆盖率为72%,符合预期。
4. 用户反馈与项目目标吻合
Alpha测试数据(32名用户):- 满意度评分:核心问答功能得分4.2 / 5。

主要建议:PDF解析准确度仍有提升空间,界面交互流程建议优化。
认可度:90%用户表示系统大幅提升了文档查阅效率。
二、计划执行情况

  1. 原计划时间评估合理
    充足部分:
    需求分析:3天,高效完成;
    文档撰写:2天,进度可控。
    紧张部分: -Milvus索引调优延迟2天;
    前端流式展示因状态管理复杂推迟1天。
  2. 各类任务完成情况
    任务类型 计划数 完成数 完成率 原因分析
    核心功能 8 8 100% 优先级明确,聚焦核心
    扩展功能 5 4 80% RBAC延迟
    优化任务 6 5 83% 部分性能优化时间不足
  3. 交付件定义清晰
    API接口文档:结构清晰,定义标准。
    数据库设计:含ER图与字段说明。
    核心算法说明:包括RAG流程伪代码及应用示例。
  4. 计划执行中的风险及应对
    风险1:Milvus版本不一致
    问题:本地2.3.0与Docker 2.4.0存在API差异;
    解决:统一使用Docker部署,并增加版本检测脚本。
    风险2:嵌入模型显存问题
    问题:all-MiniLM-L6-v2模型在8GB内存机器上无法加载;
    解决:增加内存检查逻辑,并提供轻量级模型备选项。
  5. 未来计划调整方向
    每项技术引入前预留0.5-1天调研;
    每3天进行一次滚动回顾与计划调整;
    总体预留15%风险缓冲。
    三、资源情况
  6. 资源评估- 充足资源:黄思聪具备Python开发基础,开发环境与工具完善(Git、Docker、Markdown、Swagger等)。
    稀缺资源:缺乏大规模真实政策类PDF文档作为测试数据。
  7. 时间评估准确度
    API与数据库开发任务误差均在±0.5天范围;
    低估项:
    PDF解析优化:从预估2天增长至3.5天;
    流式展示前端调试耗时翻倍(兼容性问题)。
  8. 非编程资源配置- 测试人员:单人兼任测试角色,基本满足当前需求,但自动化能力需提升。
    UI设计与文档:时间低估2–3天,后期通过迭代补齐。
  9. 效率提升空间
    初期代码审查缺乏规范 → 后期引入checklist,效率提升40%;
    环境配置由手动转为Docker镜像共享,时间节省70%;
    会议由自由讨论转为模板化,会议时长缩减30%。
    四、设计与实现

1. 模糊设计问题解决策略

向量检索阈值:
通过100组测试问答确定最优阈值为0.75;
方法:A/B测试结合人工标注。
会话记忆策略:
采用滑动窗口(保留最近10轮)+ 时间戳清理机制。

2. 工具与实践一致性

UML建模:PlantUML;
单元测试:pytest+覆盖率统计;
部分模块采用TDD。
3. 代码规范与复审执行- 规范流程:PR提交 → 自动检查(flake8/mypy)→ 双人复审 → 合并;
复审覆盖率:核心模块100%,平均时间15–30分钟;
规范执行率:由初期60%提升至90%。
五、测试与发布

  1. 测试计划制定情况
    覆盖核心模块;
    明确分工;
    性能测试场景仍待补充。
  2. 验收测试情况
    内部测试:交叉测试覆盖核心流程;
    外部测试:32人参与,收集127条反馈,GitHub闭环率92%。
  3. 测试工具与改进计划
    当前工具:
    后端API:pytest + coverage;
    API接口测试:httpx;
    前端:人工测试;
    性能测试:locust。
    未来改进:
    引入Playwright进行前端自动化;
    建立性能基线及监控指标。
  4. 软件效能数据
    平均响应时间:非流式3.2s,流式首字节1.1s;
    并发能力:支持20并发,响应均在5s内;
    PDF处理峰值内存:2.1GB;
    压测发现Milvus连接池耗尽问题,已通过参数优化解决。
  5. 发布问题与解决
    Docker构建失败:依赖版本冲突,已切换为Pipenv管理;
    Safari兼容性问题:采用浏览器识别降级策略规避异常。
    六、成员贡献(Alpha阶段)
    姓名 角色 主要贡献
    黄思聪 全栈开发者 独立完成需求分析、架构设计、核心功能编码、前端展示、PDF解析与部署流程。
    贡献评分依据:

技术复杂度:40%
工作完成度:30%
文档与质量:20%
协作与自我反馈:10%
七、阶段关键数据统计
指标类别 具体指标 Alpha目标 实际达成 完成率
功能完成 核心功能数 8 8 100%
扩展功能数 5 4 80%
时间管理 总工期 27天 27天 100%
质量指标 Bug总数 ≤15 7 -
用户反馈 满意度评分 ≥4.0/5 4.2/5 105%
团队效能 任务完成率 ≥85% 88% 104%
八、Beta阶段改进重点
技术债务清理(高):- 重构PDF解析逻辑;

优化内存管理,防止内存泄漏。
测试体系建立(高):

推动自动化测试覆盖核心API;
建立稳定性能测试基线。
用户体验优化(中高):

简化首次配置流程;
支持批量导入、批量操作功能。
过程改进(中):

建立可复用流程资产库;
明确需求变更记录与跟踪机制。

posted @ 2026-01-20 22:12  黄思聪  阅读(0)  评论(0)    收藏  举报