《60天AI学习计划启动 | Day 29: 结构化数据 & 报表问答》
Day 29:结构化数据 & 报表问答
学习目标
- 区分 文本 RAG vs 结构化数据查询的边界
- 用 demo 业务(电商/网站分析)练习指标语义建模
- 设计 自然语言 → 安全查询意图 JSON 的流程
核心知识点(用电商 Demo)
-
1. Demo 业务场景
- 假设一个电商网站:
DemoShop - 有订单表
orders、商品表products、用户表users
- 假设一个电商网站:
-
2. 指标 & 维度示例
- 指标(Metrics):
total_orders:订单数gmv:成交金额conversion_rate:转化率(下单用户数 / 访问用户数)
- 维度(Dimensions):
date(按天/周/月)category(商品类目)channel(PC / App / 小程序)region(地区)
- 指标(Metrics):
-
3. 自然语言到查询意图(Demo JSON)
- 问题示例:
- 「最近 7 天各类目的成交金额对比?」
- 「上个月网站整体转化率是多少?」
- 对应查询意图 JSON(示例):
{ "metric": "gmv", "dimensions": ["category"], "filters": { "date_range": "last_7_days" }, "orderBy": { "field": "gmv", "direction": "desc" }, "topN": 10 }{ "metric": "conversion_rate", "dimensions": [], "filters": { "month": "2025-01" } }
- 问题示例:
-
4. 安全约束(Demo)
- 白名单表:
orders, products, users, traffic_stats - 白名单字段:只允许在 schema 里声明的指标/维度
- 不允许:
UPDATE/DELETE/DROP等写操作,只生成SELECT
- 白名单表:
实战作业(Demo版)
-
作业 1:为 DemoShop 定义 Metric Schema 草稿
- 每条写:
name / 显示名 / 描述 / 单位 / 数据源表 - 例如:
gmv / 成交金额 / 订单实付总金额 / 元 / orderstotal_orders / 订单数 / 已支付订单数量 / 单 / orders
- 每条写:
-
作业 2:设计“自然语言 → 查询意图 JSON”结构(用 Demo 字段)
- 要求字段:
metric、dimensions[]、filters{}、timeRange、orderBy、topN
- 拿两条 demo 问题手动填一遍 JSON,看表达力是否够
- 要求字段:
-
作业 3:写 5 条 Demo 问题并手动标注查询意图
- 如:
- 「上周 App 端订单数和 PC 端订单数对比」
- 「最近 30 天 GMV 最高的前三个类目」
- 各自写出对应的
metric+dimensions+filters+timeRange+topN
- 如:
思考 / 笔记要点
- 用 DemoShop 把“语义层”走通,再类比迁移到你的真实业务
- 把「RAG 文本问题」和「结构化指标问题」分开写两份例子,后面做路由/Router Chain 时直接用
- 可以写一篇:《用一个电商 Demo 做自然语言报表查询的语义层设计》整理到博客

浙公网安备 33010602011771号