基于DWS MCP Server搭建数据分析Agent

本文分享自华为云社区《基于DWS MCP Server搭建数据分析Agent

1. 前言

MCP(Model Context Protocol)是由Anthropic于2024年11月提出的开放协议标准,旨在解决大型语言模型与外部系统(如数据库、API)交互的碎片化问题。通过标准化接口,让LLM动态理解工具功能并执行操作,降低集成成本。
通过搭建 DWS MCP Server,用户可以借助大模型的能力,以自然语言直接操作数据库,实现自然语言到 SQL 的自动转换,从而完成一键式后端查询,并在客户端直接查看结果。

2. 功能介绍

DWS MCP Server目前支持包括元数据查询、语句执行、监控信息查询等基本功能。支持功能以MCP协议中的工具(Tools)以及资源(Resource)形式向支持MCP协议的客户端暴露。

工具

DWS MCP Server 提供以下数据库管理工具:

  1. list_databases
    列出所有数据库
  2. get_activity
    从 pgxc_stat_activity视图获取最近的查询活动
  3. execute_query
    执行 SQL 查询
  4. list_schemas
    列出当前数据库中的所有模式
  5. list_tables
    列出指定模式下的所有表
  6. list_views
    列出指定模式下的所有视图
  7. get_table_info
    获取表/视图的定义
  8. get_comment
    获取模式/表的注释

可用资源

DWS MCP Server 通过 MCP 暴露以下资源:

  1. gaussdb:////{schema}/tables
    列出指定模式下的所有表
  2. gaussdb:///{schema}/views
    列出指定模式下的所有视图
  3. gaussdb:///{schema}/{table}/attributes
    列出指定表/视图所有的列
  4. system:///{system_path}
    系统信息(例如 /version)

3. Agent搭建及server配置

以下使用Cline作为客户端演示如何配置使用DWS MCP Server。可根据需求选择其他支持MCP的客户端,如Claude Desktop等

3.1 环境准备

  • 确保DWS集群版本支持psycopg2库
  • 确保使用环境python版本为3.10及以上
  • 确保安装uv版本0.6.7及以上
  • 安装VS Code客户端并安装Cline插件

3.2 下载 DWS MCP Server源码

从github下载源码

git clone https://github.com/HuaweiCloudDeveloper/mcp-server.git

说明:DWS MCP Server源码位于目录 huaweicloud_dws_mcp_inner 下,请在客户端配置步骤中使用该目录的路径进行配置

3.3 客户端配置

在所使用的的客户端中对模型API及MCP设定进行配置,使客户端能够正确识别连接DWS MCP Server及相关接口

  • 进入Cline设置界面,根据自身使用情况在API Configuration页面下填入API Provider、API Key等信息
  • 点击Cline页面右上角MCP图标进入MCP配置界面并点击Installed页签,在下方点击Configure MCP Servers,并填入以下DWS MCP Server配置
{
  "mcpServers": {
    "DWS": {
      "disabled": false,
      "timeout": 60,
      "type": "stdio",
      "command": "uv",
      "args": [
        "--directory",
        "/path/to/huaweicloud_dws_mcp_inner",
        "run",
        "server.py"
      ],
      "env": {
        "DB_HOST": "host_ip",
        "DB_PORT": "port_no",
        "DB_NAME": "database",
        "DB_USER": "username",
        "DB_PWD": "password"
      }
    }
  }
}

参数说明:将env中对应字段值替换为集群需要连接的节点对应的信息

/path/to/huaweicloud_dws_mcp_inner" 替换为huaweicloud_dws_mcp_inner目录所在路径

host_ip 替换为集群实际ip地址

port_no 替换为实际端口号

database 替换为需要连接的数据库名

username 替换为需要连接的用户名

password 替换为上述用户的密码

如果因网络问题无法使用uv,可以通过python启动server,步骤如下:

  • 在源码目录下通过pip安装dws-mcp-server

pip install .

  • 将cline的mcp server配置更换为:
{
  "mcpServers": {
    "DWS": {
      "disabled": false,
      "timeout": 60,
      "type": "stdio",
      "command": "python",
      "args": [
 
        "/path/to/huaweicloud_dws_mcp_inner/src/server.py",
      ],
      "env": {
        "DB_HOST": "host_ip",
        "DB_PORT": "port_no",
        "DB_NAME": "database",
        "DB_USER": "username",
        "DB_PWD": "password"
      }
    }
  }
}

/path/to/huaweicloud_dws_mcp_inner/src/server.py 替换为 DWS MCP Server 源码中server.py的完整路径。

保存配置信息后,观察cline mcp页面是否成功加载DWS mcp server,若如下图能够加载DWS server及显示对应工具及资源说明配置成功

3.4 DWS集群配置

DWS MCP Server通过 Psycopg2 连接集群,需要对集群进行如下配置确保网络连接畅通

  • 编辑集群安装目录下CN节点的pg_hba.conf配置文件,添加以下配置信息将客户端所在环境添加为host
  • 修改GUC参数password_encryption_type的值为1,在pg_hba.conf中将上述新增的host加密算法更改为md5,修改后需重启数据库并重新设置用户密码,以使新密码采用 MD5 算法存储。
  • 编辑postgresql.conf文件,将客户端所在环境的ip地址增加至listen_addresses
host    <允许访问的库>        <允许的用户名>        <客户端ip/掩码>        <加密算法>
  • 修改GUC参数password_encryption_type的值为1,在pg_hba.conf中将上述新增的host加密算法更改为md5,修改后需重启数据库并重新设置用户密码,以使新密码采用 MD5 算法存储。
  • 编辑postgresql.conf文件,将客户端所在环境的ip地址增加至listen_addresses
listen_addresses = 'localhost,<client_ip>'

集群环境可通过设置GUC参数完成上述配置:

gs_guc set -N all -I all -Z coordinator -c "listen_addresses='*'"
gs_guc set -N all -I all -Z coordinator -h "host all all 0.0.0.0/0 md5"
gs_guc reload -Z coordinator -Z datanode -N all -I all -c "password_encryption_type=1"

4 开始体验

完成客户端及集群相关配置后,开始搭建以DWS + MCP + LLM为核心的数据分析工作流。以下以cline为客户端进行演示。

根据tpcds相关表的数据,对1998-2002年间的销售情况进行一系列分析并提出洞察与建议,最终交付数据分析报告。

DWS + MCP server为LLM提供了准确的数据来源,依赖模型的推理和分析能力,我们可以在无需手动编写SQL查询语句的情况下获取数据,用自然语言一键式完成查询,并进一步借助LLM对数据进行初步的分析和洞悉。

回答内容与风格取决于模型能力,示例仅作为参考

1. 在cline的对话框中输入需要完成的数据分析任务的promt

2. 发送任务后,cline会调用模型并依据推理结果发起一系列tools或resource的调用请求。观察请求主体并选择同意(可以按需开启自动同意执行)

  • 模型解析任务并生成plan
  • 调用工具获取元数据信息
  • 根据元数据推理并生成查询,获取具体数据

3. 通过一系列与DWS的交互以及获取的查询结果进行分析,最终呈现结果

  • 生成报告

  • 输出总结

5 总结

通过搭建 DWS‑MCP‑Server,企业与科研团队即可将自然语言对话与关系数据库无缝衔接,实现“一键查询、自动化报表、动态分析”的全链路数据服务。按手册步骤完成配置后,LLM 将直接识别工具接口(如 list_databases、execute_query 等),在安全约束内调用接口进行 SQL 生成与执行。元数据查询(schema、tables、views)与业务查询结果无缝串联,随后模型可立即进行业务解读、可视化图表与洞察报告的自动生成。该方案不仅显著降低了传统 SQL 开发的学习曲线和运维成本,还提升了数据迭代的响应速度,为数据驱动决策提供了高度可靠且易扩展的技术平台。在自然语言接口与 AI 推理能力进一步成熟的今天,DWS‑MCP‑Server 能够成为企业数据治理、实时分析与跨团队协作的巨大助力。

 

posted @ 2025-12-19 16:26  华为云开发者联盟  阅读(25)  评论(0)    收藏  举报