OceanBase 年度发布会 Hands-on AI Workshop 回顾

简介

本次 Workshop 是 OceanBase 新品发布会期间的特别活动,主要关注如何基于 OceanBase seekdb 快速构建 AI 原生应用。活动打破了常规的 PPT 宣讲模式,重点在于代码实操。在来自 LangChain Community、Dify 和 OceanBase 的技术专家指导下,现场数百名开发者在两小时内,基于 seekdb 实际动手完成了从环境部署、Agentic RAG 搭建到构建具备“长期记忆”智能体的完整开发流程。

现场小伙伴直观感受到了具备原生 AI 能力的轻量数据库是如何有效降低应用开发门槛的。本文将详细回顾这场实战 Workshop。

一、OceanBase seekdb 介绍

本次 Workshop 的所有实验均基于 OceanBase seekdb 进行,这是 OceanBase 推出的面向 AI 应用场景的轻量嵌入式数据库。

解决什么问题?在目前的 AI 应用开发架构中,开发者通常需要同时维护关系型数据库(存储结构化数据)和向量数据库(存储非结构化向量数据)。这种架构不仅带来了较高的数据一致性维护成本,还可能产生跨系统查询的延迟。seekdb 的设计目标是实现“结构化数据”与“非结构化向量数据”的统一存储与检索,并以 1C2G 轻量的方式简化 AI 应用的数据架构。

二、Workshop 环境配置环境指南

Workshop 的第一个环节是基础环境配置。现场为了规避 Wi-Fi 网络高并发可能带来的延迟,我们为每位参会者都准备了阿里云 ECS 云服务器作为实验环境。以下是本地电脑(Mac/Windows)详细安装流程(以 CLI 为主):

  1. Docker (用于三个实验)
    Mac: 下载 Docker Desktop 并安装。
    Windows: 同样下载 Docker Desktop,需开启 WSL2,安装后启动 Docker 应用。
  2. Python 3.10+ (用于三个实验)
    下载 Python 官方安装包 进行安装。
    安装完成后检查:
python --version # 应输出 3.10 或更高
  1. uv (Python 包管理器)
pip install uv
  1. seekdb (用于三个实验)

我们将使用 Docker 快速启动一个 seekdb 实例。针对国内网络环境和不同的芯片架构,提供了相应的镜像源。

# 获取docker 镜像
docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/oceanbase/seekdb:latest
docker tag  swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/oceanbase/seekdb:latest  docker.io/oceanbase/seekdb:latest

# arm机器
docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/oceanbase/seekdb:latest-linuxarm64
docker tag  swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/oceanbase/seekdb:latest-linuxarm64  docker.io/oceanbase/seekdb:latest

# 方式一: docker 方式安装
docker run -d \
  --name seekdb \
  -p 2881:2881 \
  -v ./data:/var/lib/oceanbase/store \
  oceanbase/seekdb:latest
  1. powermem (用于实验三)
pip install powermem
  1. Dify(用于实验二)
git clone https://github.com/langgenius/dify.git
cd dify/docker
docker-compose up -d
  1. Jupyter(用于实验一)
pip install jupyter
  1. Qoder: 下载: https://qoder.com/download (选择适合自己的电脑的qoder包下载,请注意 qoder 需要注册方可使用。)

三、基于 LangChain V1 和 OceanBase seekdb

快速构建 Agentic RAG

讲师:LangChain Ambassador 张海立

本实验基于 LangChain v1 的最新 Agent 构建标准和 OceanBase seekdb 的向量存储和混合检索能力,让 AI 读懂一份 Nike 2023 财报(PDF),并能回答相关财务问题。 核心逻辑: 文档切片 -> 存入 seekdb -> 封装为 Tool -> 绑定 Agent。

  • 将一份非结构化的 Nike 2023 财报 PDF 文档转化为计算机可理解的向量数据
  • 通过定义检索工具并调用 LangChain v1 的 create_agent 接口,打造具备推理能力的 AI Agent。

核心操作步骤

步骤 1:文档处理与向量化 首先,我们需要将 PDF 文档加载并切割成适合模型处理的小块(Chunks)。 在 LangChain 中,我们使用 PyPDFLoader 加载文档,然后使用 RecursiveCharacterTextSplitter 进行切分。

from langchain_community.vectorstores import OceanBase

# 初始化 OceanBase 向量存储
docsearch = OceanBase.from_documents(
    documents, 
    embeddings, 
    connection_string="127.0.0.1:2881..."
)

这一步在后台,seekdb 会自动创建一张表,并将文本的向量(Embedding Vector)和原始内容存储在同一行记录中。

步骤 2:构建检索工具 我们将上一步生成的 docsearch 封装为一个 LangChain Tool。

retriever_tool = create_retriever_tool(
    docsearch.as_retriever(),
    "nike_financial_report",
    "搜索并返回关于 Nike 2023 财报的详细信息。"
)

注意 description 参数非常重要,LLM 会根据这段描述来判断何时调用这个工具。

步骤 3:初始化 Agent 并执行 使用 LangChain V1 的 create_tool_calling_agent 接口,将 LLM(如 GPT-4 或通义千问)与我们定义的工具绑定。

详细步骤请参考:https://ask.oceanbase.com/t/topic/35634850

四、基于 Dify 和 OceanBase,快速构建 AI 应用

讲师:郑立,Sr. Developer Relations, Dify

本实验旨在验证 OceanBase seekdb 对 AI 应用的一体化支撑能力。通过部署 seekdb 并修改 Dify 核心配置,将原本分离的向量库与元数据库统一替换为 seekdb。在简化架构的同时,验证在 RAG 场景下的完整可用性。

核心操作步骤

步骤 1:修改 Docker Compose 配置 进入 Dify 的 docker 目录,编辑 .env 文件或 docker-compose.yaml。需要将 Dify 的数据库连接指向我们启动的 seekdb 容器。

步骤 2:配置向量后端 在 Dify 的系统设置文件或环境变量中,将 Vector Store 的类型指定为 OceanBase。当用户在 Dify 界面上传知识库文件时,Dify 会将切片后的向量数据写入 seekdb 的向量表中。

步骤 3:构建知识库应用 重启 Dify 容器组后,进入 Web 界面:

详细步骤请参考:https://ask.oceanbase.com/t/topic/35634856

五、让 AI 记住你,基于 OceanBase 构建具备上下文记忆的智能体实践

讲师:汤庆 OceanBase 技术专家

本实验核心目标是解决 AI 智能体“遗忘”对话上下文的问题。通过集成 OceanBase seekdb 作为向量与结构化数据的混合存储底座,并使用 PowerMem 进行记忆管理,展示了如何让 AI 拥有“长期记忆”。

步骤 1:部署 PowerMem,Dify + PowerMem MCP 环境集成,我们在 Dify 环境中配置 PowerMem MCP,打通底层记忆通道。这一步也使其具备了访问 OceanBase seekdb 进行长久记忆存储与检索的能力。

步骤 2:Vibe Coding 挑战,我们将一段提示词复制到 AI 编程助手 Qoder 中,要求它参照 PowerMem 的官方示例,自动生成一套代码审查智能体。

详细步骤请参考:https://ask.oceanbase.com/t/topic/35634483

最后

通过上述三个实验,我们从不同维度验证了 OceanBase seekdb 在 AI 应用开发中的实际能力。本次 Workshop 只是一个起点。seekdb 的轻量化和易用性,旨在让每一位开发者都能在自己的笔记本上,以最低的成本探索 AI 原生应用的开发。

在此,我们要特别致谢参与本次社区生态共建的开源伙伴,感谢 Dify, LangChain Community, Qoder 的鼎力支持,感谢每一位参与的开发者。

posted on 2025-11-28 16:02  老纪的技术唠嗑局  阅读(0)  评论(0)    收藏  举报