《60天AI学习计划启动 | Day 29: 结构化数据 & 报表问答》

Day 29:结构化数据 & 报表问答

学习目标

  • 区分 文本 RAG vs 结构化数据查询的边界
  • 用 demo 业务(电商/网站分析)练习指标语义建模
  • 设计 自然语言 → 安全查询意图 JSON 的流程

核心知识点(用电商 Demo)

  • 1. Demo 业务场景

    • 假设一个电商网站:DemoShop
    • 有订单表 orders、商品表 products、用户表 users
  • 2. 指标 & 维度示例

    • 指标(Metrics):
      • total_orders:订单数
      • gmv:成交金额
      • conversion_rate:转化率(下单用户数 / 访问用户数)
    • 维度(Dimensions):
      • date(按天/周/月)
      • category(商品类目)
      • channel(PC / App / 小程序)
      • region(地区)
  • 3. 自然语言到查询意图(Demo JSON)

    • 问题示例:
      • 「最近 7 天各类目的成交金额对比?」
      • 「上个月网站整体转化率是多少?」
    • 对应查询意图 JSON(示例):
      {
        "metric": "gmv",
        "dimensions": ["category"],
        "filters": { "date_range": "last_7_days" },
        "orderBy": { "field": "gmv", "direction": "desc" },
        "topN": 10
      }
      
      {
        "metric": "conversion_rate",
        "dimensions": [],
        "filters": { "month": "2025-01" }
      }
      
  • 4. 安全约束(Demo)

    • 白名单表:orders, products, users, traffic_stats
    • 白名单字段:只允许在 schema 里声明的指标/维度
    • 不允许:UPDATE/DELETE/DROP 等写操作,只生成 SELECT

实战作业(Demo版)

  • 作业 1:为 DemoShop 定义 Metric Schema 草稿

    • 每条写:name / 显示名 / 描述 / 单位 / 数据源表
    • 例如:
      • gmv / 成交金额 / 订单实付总金额 / 元 / orders
      • total_orders / 订单数 / 已支付订单数量 / 单 / orders
  • 作业 2:设计“自然语言 → 查询意图 JSON”结构(用 Demo 字段)

    • 要求字段:
      • metricdimensions[]filters{}timeRangeorderBytopN
    • 拿两条 demo 问题手动填一遍 JSON,看表达力是否够
  • 作业 3:写 5 条 Demo 问题并手动标注查询意图

    • 如:
      • 「上周 App 端订单数和 PC 端订单数对比」
      • 「最近 30 天 GMV 最高的前三个类目」
    • 各自写出对应的 metric+dimensions+filters+timeRange+topN

思考 / 笔记要点

  • 用 DemoShop 把“语义层”走通,再类比迁移到你的真实业务
  • 把「RAG 文本问题」和「结构化指标问题」分开写两份例子,后面做路由/Router Chain 时直接用
  • 可以写一篇:《用一个电商 Demo 做自然语言报表查询的语义层设计》整理到博客
posted @ 2025-12-17 09:36  XiaoZhengTou  阅读(2)  评论(0)    收藏  举报