[T.16] 团队项目:Beta 阶段测试报告

项目 内容
这个作业属于哪个课程 首页 - 2026年春季软件工程 - 北京航空航天大学 - 班级博客 - 博客园
这个作业的要求在哪里 [T.16] 团队项目:Beta 阶段测试报告 - 作业 - 2026年春季软件工程 - 班级博客 - 博客园
我在这个课程的目标是 学习并实践现代软件工程的完整开发流程,提升全栈开发与团队协作能力
这个作业在哪个具体方面帮助我实现目标 本次作业通过系统化的 Beta 阶段测试与缺陷回归,帮助团队建立质量保障体系,并验证产品是否满足发布要求

一、测试目标

Beta 阶段的测试目标不是简单确认“页面能打开”,而是验证启元知微是否已经能支撑真实复习链路:学生能围绕课程资料提问,能查看带引用来源的回答,能从题库和错题本进入专项复练,能在论坛讨论问题;管理员能处理违规内容,团队也能通过统计和健康检查观察系统运行状态。

因此,本阶段测试围绕以下出口目标展开:

  1. 核心学习链路可闭环:登录、问答、引用溯源、题库练习、错题复练、AI 深度解析、论坛讨论均可走通。
  2. Beta 新增功能可用:RAG 引用元数据、错题复练、行为统计、论坛治理、移动端适配等功能通过验收。
  3. 高风险接口受保护:AI 问答、AI 解析等高成本接口具备限流和错误提示。
  4. 发布环境可运维:数据库迁移、RAG 服务、Redis、健康检查、CI/CD 和备份流程可验证。

二、测试计划

测试范围架构图

2.1 测试层级

测试类型 目标 主要对象 方法
单元测试 验证局部逻辑正确性 题库树构建、知识问答 schema、RAG API、图像问答等 pytest
接口测试 验证前后端契约 登录、问答、题库、论坛、错题本、管理员接口 OpenAPI、手工 API 调用、联调
场景测试 验证真实用户任务 复习、刷题、错题复练、发帖、管理员处理举报 黑盒测试
兼容性测试 验证不同设备可用性 PC、移动端浏览器、暗色主题 多浏览器人工测试
回归测试 验证 Bug 修复未破坏旧功能 Alpha 核心路径与 Beta 新链路 缺陷清单逐项复测
发布测试 验证线上可部署可回滚 Docker Compose、CI/CD、健康检查、备份 部署演练

2.2 自动化测试现状

仓库中已经具备如下自动化测试基础:

仓库 测试文件数 测试函数数 覆盖重点
Backend 4 11 知识问答 schema、RAG 调试接口、题库树与题目 ID 收集
RAG 2 11 health、retrieve 参数校验、notes 接口、image QA 回退链路
Frontend 以构建检查为主 - TypeScript 类型检查、Vite 生产构建、ESLint/Prettier 规范

此外,项目三仓共配置 6 条 GitHub Actions 工作流,覆盖 CI 与部署流程。Beta 阶段发布前要求三仓构建或测试通过后再合入发布分支。

2.3 测试数据

测试数据主要来自三类:

  1. 课程知识库:数据库系统、操作系统、编译原理等课程资料。
  2. 题库数据:往年题、模拟考试题、父子题、多选题、解析、标签。
  3. 用户数据:普通用户、VIP 用户、超级管理员、被禁言用户、发帖用户、错题用户。

测试中特别构造了以下边界数据:

  • 多选题漏选、错选、全选;
  • 父子题嵌套结构;
  • 错题 Session 过期后提交;
  • 长 Markdown、公式、Mermaid 图;
  • 移动端窄屏下长帖和引用卡片;
  • 管理员删除回复、下架帖子、临时禁言账号;
  • RAG 检索无结果、RAG 服务超时、LLM 流式输出中断。

三、场景测试

场景一:期末复习中的知识问答与引用核对

用户画像:北航计算机学院本科生小明,正在复习操作系统。

目标:快速理解“工作集”“页面置换”“虚拟内存”等概念,并确认答案来自课程资料。

测试步骤:

  1. 用户登录启元知微。
  2. 进入知识问答,选择“操作系统”课程。
  3. 提问“工作集模型为什么能减少颠簸?”
  4. 观察系统是否流式输出回答。
  5. 点击回答中的引用角标,查看来源文件、页码或片段摘要。
  6. 继续追问“它和 LRU 有什么区别?”
  7. 删除会话,确认历史列表更新。

验收结果:核心链路通过。引用溯源让回答从“模型说了什么”变成“可以回到哪份资料核对”,符合 Beta 阶段对 RAG 可信度的要求。

知识问答页面

场景二:错题筛选、复练与 AI 深度解析

用户画像:考前刷题的学生,错题分散在多次模拟考试记录中。

目标:从错题本筛选薄弱题目,一键生成专项复练,并在不会的题目上获得 AI 深度解析。

测试步骤:

  1. 用户进入题库资料 -> 错题本。
  2. 按课程、错题频次、掌握状态进行筛选。
  3. 点击“一键复练”,生成临时测试 Session。
  4. 完成答题并提交。
  5. 对再次答错的题目点击“AI 深度解析”。
  6. 检查解析是否流式输出,是否能结合课程上下文解释。
  7. 检查新错题是否回收到错题本。

验收结果:主路径通过。测试中发现“Session 过期后提交返回 500”的缺陷,已修复为明确的过期提示,并在修复后通过回归。

错题本筛选与复练

AI 深度解析流式输出

场景三:学习论坛互动

目标:普通用户可以发帖、回复、点赞、举报,保障基本社区活跃度。

测试步骤:

  1. 普通用户进入论坛,发布带 Markdown 和代码块的帖子。
  2. 另一用户浏览板块并搜索帖子。
  3. 用户进行回复互动并点赞优秀答案。
  4. 遇到违规内容时,使用前台提供的举报功能记录问题。

验收结果:基本互动链路通过。

场景四:移动端复习与暗色主题

用户画像:学生在手机浏览器中查看问答记录和论坛长帖。

目标:移动端不出现横向溢出、遮挡、无法点击等问题,暗色主题下公式和 Mermaid 图可读。

测试步骤:

  1. 使用 iOS Safari、Android Chrome 或浏览器移动视图打开站点。
  2. 查看知识问答消息流、引用卡片、论坛列表、长帖、错题复练页面。
  3. 切换暗色主题。
  4. 检查 Markdown、公式、代码块、Mermaid 图的可读性。

验收结果:主要页面通过。测试中发现“引用卡片 iOS Safari 触控定位偏移”和“Mermaid 暗色模式边框色不清晰”,均已修复。

四、缺陷发现与修复情况

Beta 集中回归中,团队重点记录了发布前黑盒测试发现的 3 个明确缺陷,均已在 Beta 缺陷清单或对应 Issue 评论中跟踪并修复。

编号 缺陷 影响 处理方式 状态
BUG-01 引用卡片在 iOS Safari 下触控定位偏移 移动端点击引用时卡片位置不准 调整移动端定位计算与边界约束 已修复
BUG-02 错题复练 Session 过期后提交返回 500 用户看到服务错误,不知道原因 增加 Session TTL 判断与业务错误提示 已修复
BUG-03 禁言用户刷新 token 后状态冲突 被禁言用户可能获得不一致权限状态 统一禁言校验位置,刷新后仍执行权限判断 已修复

此外,Alpha 阶段复盘出的 5 类痛点被转化为 Beta 需求并关闭:RAG 问答无溯源、错题复练断链、缺运营埋点、论坛治理缺失、移动端体验不完善。

五、测试矩阵

5.1 平台与浏览器矩阵

平台 浏览器 测试内容 结果
Windows 11 Chrome 最新版 登录、问答、题库、论坛、管理员面板 通过
Windows 11 Edge 最新版 知识问答、错题复练、图床工具 通过
Windows 11 Firefox 最新版 Markdown、论坛、题库浏览 通过
macOS Safari / Chrome SSE 流式输出、引用卡片、暗色主题 通过
iOS Safari 移动端问答、引用卡片、论坛长帖 修复后通过
Android Chrome 题库、错题本、论坛列表 通过

5.2 服务与依赖矩阵

依赖 用途 测试点 结果
MySQL 用户、题库、论坛、对话持久化 Alembic 迁移、读写、备份 通过
Redis 登录限流、缓存、Session、埋点缓冲 TTL、限流、队列消费 通过
RAG 服务 检索增强问答、引用元数据 health、retrieve、chat/stream 通过
LLM/Embedding API 生成回答与向量化 超时、错误回退、限流提示 通过
OSS/图床 图片上传与文档写作 上传、复制链接、历史记录 通过

六、Beta 出口条件

我们将 Beta 版本出口条件定义为:

  1. beta-01 至 #beta-15 的功能、质量和部署任务完成或有明确豁免说明。

  2. 三仓 CI/CD 通过,前端能生产构建,Backend 与 RAG 自动化测试通过。
  3. 数据库迁移脚本可从空库升级到最新版本,发布环境可成功启动。
  4. 知识问答、错题复练、题库、论坛、管理员治理、图床工具等核心路径通过场景测试。
  5. 发布前黑盒测试中的 P0/P1 缺陷均已修复;剩余已知问题不阻塞核心学习链路。
  6. 线上健康检查可访问,管理员统计视图能展示服务状态。
  7. 运行环境、安装使用方式、已知限制和发布地址已经写入发布说明。

七、测试结论

Beta 测试表明,启元知微已经从 Alpha 阶段的“核心功能可演示”推进到“真实学习链路可闭环”。本阶段最有价值的改进不只是新增功能数量,而是系统可信度、可治理性和可观测性的提升:RAG 回答可以溯源,错题可以复练,论坛违规可以处理,发布后团队可以看到服务健康与活跃数据。

仍需改进的方向包括:进一步扩大自动化测试覆盖范围,引入前端 E2E 测试,完善真实用户行为埋点的长期统计,并继续补充更多课程资料。

posted @ 2026-06-18 19:27  HakimiSN  阅读(6)  评论(0)    收藏  举报