[T.16] 团队项目:Beta 阶段测试报告
| 项目 | 内容 |
|---|---|
| 这个作业属于哪个课程 | 首页 - 2026年春季软件工程 - 北京航空航天大学 - 班级博客 - 博客园 |
| 这个作业的要求在哪里 | [T.16] 团队项目:Beta 阶段测试报告 - 作业 - 2026年春季软件工程 - 班级博客 - 博客园 |
| 我在这个课程的目标是 | 学习并实践现代软件工程的完整开发流程,提升全栈开发与团队协作能力 |
| 这个作业在哪个具体方面帮助我实现目标 | 本次作业通过系统化的 Beta 阶段测试与缺陷回归,帮助团队建立质量保障体系,并验证产品是否满足发布要求 |
一、测试目标
Beta 阶段的测试目标不是简单确认“页面能打开”,而是验证启元知微是否已经能支撑真实复习链路:学生能围绕课程资料提问,能查看带引用来源的回答,能从题库和错题本进入专项复练,能在论坛讨论问题;管理员能处理违规内容,团队也能通过统计和健康检查观察系统运行状态。
因此,本阶段测试围绕以下出口目标展开:
- 核心学习链路可闭环:登录、问答、引用溯源、题库练习、错题复练、AI 深度解析、论坛讨论均可走通。
- Beta 新增功能可用:RAG 引用元数据、错题复练、行为统计、论坛治理、移动端适配等功能通过验收。
- 高风险接口受保护:AI 问答、AI 解析等高成本接口具备限流和错误提示。
- 发布环境可运维:数据库迁移、RAG 服务、Redis、健康检查、CI/CD 和备份流程可验证。
二、测试计划

2.1 测试层级
| 测试类型 | 目标 | 主要对象 | 方法 |
|---|---|---|---|
| 单元测试 | 验证局部逻辑正确性 | 题库树构建、知识问答 schema、RAG API、图像问答等 | pytest |
| 接口测试 | 验证前后端契约 | 登录、问答、题库、论坛、错题本、管理员接口 | OpenAPI、手工 API 调用、联调 |
| 场景测试 | 验证真实用户任务 | 复习、刷题、错题复练、发帖、管理员处理举报 | 黑盒测试 |
| 兼容性测试 | 验证不同设备可用性 | PC、移动端浏览器、暗色主题 | 多浏览器人工测试 |
| 回归测试 | 验证 Bug 修复未破坏旧功能 | Alpha 核心路径与 Beta 新链路 | 缺陷清单逐项复测 |
| 发布测试 | 验证线上可部署可回滚 | Docker Compose、CI/CD、健康检查、备份 | 部署演练 |
2.2 自动化测试现状
仓库中已经具备如下自动化测试基础:
| 仓库 | 测试文件数 | 测试函数数 | 覆盖重点 |
|---|---|---|---|
| Backend | 4 | 11 | 知识问答 schema、RAG 调试接口、题库树与题目 ID 收集 |
| RAG | 2 | 11 | health、retrieve 参数校验、notes 接口、image QA 回退链路 |
| Frontend | 以构建检查为主 | - | TypeScript 类型检查、Vite 生产构建、ESLint/Prettier 规范 |
此外,项目三仓共配置 6 条 GitHub Actions 工作流,覆盖 CI 与部署流程。Beta 阶段发布前要求三仓构建或测试通过后再合入发布分支。
2.3 测试数据
测试数据主要来自三类:
- 课程知识库:数据库系统、操作系统、编译原理等课程资料。
- 题库数据:往年题、模拟考试题、父子题、多选题、解析、标签。
- 用户数据:普通用户、VIP 用户、超级管理员、被禁言用户、发帖用户、错题用户。
测试中特别构造了以下边界数据:
- 多选题漏选、错选、全选;
- 父子题嵌套结构;
- 错题 Session 过期后提交;
- 长 Markdown、公式、Mermaid 图;
- 移动端窄屏下长帖和引用卡片;
- 管理员删除回复、下架帖子、临时禁言账号;
- RAG 检索无结果、RAG 服务超时、LLM 流式输出中断。
三、场景测试
场景一:期末复习中的知识问答与引用核对
用户画像:北航计算机学院本科生小明,正在复习操作系统。
目标:快速理解“工作集”“页面置换”“虚拟内存”等概念,并确认答案来自课程资料。
测试步骤:
- 用户登录启元知微。
- 进入知识问答,选择“操作系统”课程。
- 提问“工作集模型为什么能减少颠簸?”
- 观察系统是否流式输出回答。
- 点击回答中的引用角标,查看来源文件、页码或片段摘要。
- 继续追问“它和 LRU 有什么区别?”
- 删除会话,确认历史列表更新。
验收结果:核心链路通过。引用溯源让回答从“模型说了什么”变成“可以回到哪份资料核对”,符合 Beta 阶段对 RAG 可信度的要求。

场景二:错题筛选、复练与 AI 深度解析
用户画像:考前刷题的学生,错题分散在多次模拟考试记录中。
目标:从错题本筛选薄弱题目,一键生成专项复练,并在不会的题目上获得 AI 深度解析。
测试步骤:
- 用户进入题库资料 -> 错题本。
- 按课程、错题频次、掌握状态进行筛选。
- 点击“一键复练”,生成临时测试 Session。
- 完成答题并提交。
- 对再次答错的题目点击“AI 深度解析”。
- 检查解析是否流式输出,是否能结合课程上下文解释。
- 检查新错题是否回收到错题本。
验收结果:主路径通过。测试中发现“Session 过期后提交返回 500”的缺陷,已修复为明确的过期提示,并在修复后通过回归。


场景三:学习论坛互动
目标:普通用户可以发帖、回复、点赞、举报,保障基本社区活跃度。
测试步骤:
- 普通用户进入论坛,发布带 Markdown 和代码块的帖子。
- 另一用户浏览板块并搜索帖子。
- 用户进行回复互动并点赞优秀答案。
- 遇到违规内容时,使用前台提供的举报功能记录问题。
验收结果:基本互动链路通过。
场景四:移动端复习与暗色主题
用户画像:学生在手机浏览器中查看问答记录和论坛长帖。
目标:移动端不出现横向溢出、遮挡、无法点击等问题,暗色主题下公式和 Mermaid 图可读。
测试步骤:
- 使用 iOS Safari、Android Chrome 或浏览器移动视图打开站点。
- 查看知识问答消息流、引用卡片、论坛列表、长帖、错题复练页面。
- 切换暗色主题。
- 检查 Markdown、公式、代码块、Mermaid 图的可读性。
验收结果:主要页面通过。测试中发现“引用卡片 iOS Safari 触控定位偏移”和“Mermaid 暗色模式边框色不清晰”,均已修复。
四、缺陷发现与修复情况
Beta 集中回归中,团队重点记录了发布前黑盒测试发现的 3 个明确缺陷,均已在 Beta 缺陷清单或对应 Issue 评论中跟踪并修复。
| 编号 | 缺陷 | 影响 | 处理方式 | 状态 |
|---|---|---|---|---|
| BUG-01 | 引用卡片在 iOS Safari 下触控定位偏移 | 移动端点击引用时卡片位置不准 | 调整移动端定位计算与边界约束 | 已修复 |
| BUG-02 | 错题复练 Session 过期后提交返回 500 | 用户看到服务错误,不知道原因 | 增加 Session TTL 判断与业务错误提示 | 已修复 |
| BUG-03 | 禁言用户刷新 token 后状态冲突 | 被禁言用户可能获得不一致权限状态 | 统一禁言校验位置,刷新后仍执行权限判断 | 已修复 |
此外,Alpha 阶段复盘出的 5 类痛点被转化为 Beta 需求并关闭:RAG 问答无溯源、错题复练断链、缺运营埋点、论坛治理缺失、移动端体验不完善。
五、测试矩阵
5.1 平台与浏览器矩阵
| 平台 | 浏览器 | 测试内容 | 结果 |
|---|---|---|---|
| Windows 11 | Chrome 最新版 | 登录、问答、题库、论坛、管理员面板 | 通过 |
| Windows 11 | Edge 最新版 | 知识问答、错题复练、图床工具 | 通过 |
| Windows 11 | Firefox 最新版 | Markdown、论坛、题库浏览 | 通过 |
| macOS | Safari / Chrome | SSE 流式输出、引用卡片、暗色主题 | 通过 |
| iOS | Safari | 移动端问答、引用卡片、论坛长帖 | 修复后通过 |
| Android | Chrome | 题库、错题本、论坛列表 | 通过 |
5.2 服务与依赖矩阵
| 依赖 | 用途 | 测试点 | 结果 |
|---|---|---|---|
| MySQL | 用户、题库、论坛、对话持久化 | Alembic 迁移、读写、备份 | 通过 |
| Redis | 登录限流、缓存、Session、埋点缓冲 | TTL、限流、队列消费 | 通过 |
| RAG 服务 | 检索增强问答、引用元数据 | health、retrieve、chat/stream | 通过 |
| LLM/Embedding API | 生成回答与向量化 | 超时、错误回退、限流提示 | 通过 |
| OSS/图床 | 图片上传与文档写作 | 上传、复制链接、历史记录 | 通过 |
六、Beta 出口条件
我们将 Beta 版本出口条件定义为:
-
beta-01 至 #beta-15 的功能、质量和部署任务完成或有明确豁免说明。
- 三仓 CI/CD 通过,前端能生产构建,Backend 与 RAG 自动化测试通过。
- 数据库迁移脚本可从空库升级到最新版本,发布环境可成功启动。
- 知识问答、错题复练、题库、论坛、管理员治理、图床工具等核心路径通过场景测试。
- 发布前黑盒测试中的 P0/P1 缺陷均已修复;剩余已知问题不阻塞核心学习链路。
- 线上健康检查可访问,管理员统计视图能展示服务状态。
- 运行环境、安装使用方式、已知限制和发布地址已经写入发布说明。
七、测试结论
Beta 测试表明,启元知微已经从 Alpha 阶段的“核心功能可演示”推进到“真实学习链路可闭环”。本阶段最有价值的改进不只是新增功能数量,而是系统可信度、可治理性和可观测性的提升:RAG 回答可以溯源,错题可以复练,论坛违规可以处理,发布后团队可以看到服务健康与活跃数据。
仍需改进的方向包括:进一步扩大自动化测试覆盖范围,引入前端 E2E 测试,完善真实用户行为埋点的长期统计,并继续补充更多课程资料。

浙公网安备 33010602011771号