《60天AI学习计划启动 | Day 55: 基准评估 & 技术文档撰写(第二个项目收尾)》
Day 55:基准评估 & 技术文档撰写(第二个项目收尾)
学习目标
- 给 Code Assistant 做一份小型基准集(典型代码片段/报错场景)
- 跑一轮人工/半自动评估:看看各模式下回答质量
- 完成 项目级文档:README / 架构说明 / 接口说明
核心学习内容(笔记)
-
1. 基准集设计(Code Assistant 版)
- 样本类型:
- 典型报错信息 + 相关代码片段(期望 AI 能解释 & 给出修复建议)
- 可读性很差的代码(期望 AI 给合理重构建议)
- 简单函数/Hook(期望 AI 生成 Jest/Vitest 测试用例)
- 每条样本记录:
mode / language / code / question / 期望关键点(key_points[])
- 样本类型:
-
2. 评估方式
- 手动打分(最简单可行):
- 每条样本:看 AI 输出是否覆盖 key_points,打 1–5 分
- 半自动(以后可做):
- 用 LLM 做评审:
{code, question, ai_answer, expected_points}→ 输出score + reason
- 用 LLM 做评审:
- 目标:形成一个「当前版本」的 baseline,后续调 Prompt/模型时可对比
- 手动打分(最简单可行):
-
3. 文档撰写要点
- README:
- 项目简介:这是一个“前端代码助手”,能做什么
- 运行方式:依赖、启动脚本、环境变量
- 截图:主界面 / 模式切换 / 调试面板
- 架构说明:
- 前端:主要页面/组件结构(CodePanel / ChatPanel / DebugPanel 等)
- 后端:主要接口(/api/code-assistant)、调用的模型/工具
- 接口说明:
- 请求:
mode/language/code/question/history - 响应:
answer/usage/meta
- 请求:
- README:
明日学习计划预告(Day 56)
- 主题:抽离前端 AI 基础库(hooks/components/utils)
- 方向:
- 把这两个项目里通用的
useChat / useSSE / 调试面板 / Prompt 模板等抽到一个独立模块 - 为后续任何新项目「一行引入、快速接 AI」打基础
- 把这两个项目里通用的

浙公网安备 33010602011771号