基于DWS MCP Server搭建数据分析Agent
本文分享自华为云社区《基于DWS MCP Server搭建数据分析Agent》
1. 前言
MCP(Model Context Protocol)是由Anthropic于2024年11月提出的开放协议标准,旨在解决大型语言模型与外部系统(如数据库、API)交互的碎片化问题。通过标准化接口,让LLM动态理解工具功能并执行操作,降低集成成本。
通过搭建 DWS MCP Server,用户可以借助大模型的能力,以自然语言直接操作数据库,实现自然语言到 SQL 的自动转换,从而完成一键式后端查询,并在客户端直接查看结果。
2. 功能介绍
DWS MCP Server目前支持包括元数据查询、语句执行、监控信息查询等基本功能。支持功能以MCP协议中的工具(Tools)以及资源(Resource)形式向支持MCP协议的客户端暴露。
工具
DWS MCP Server 提供以下数据库管理工具:
- list_databases
列出所有数据库 - get_activity
从pgxc_stat_activity视图获取最近的查询活动 - execute_query
执行 SQL 查询 - list_schemas
列出当前数据库中的所有模式 - list_tables
列出指定模式下的所有表 - list_views
列出指定模式下的所有视图 - get_table_info
获取表/视图的定义 - get_comment
获取模式/表的注释
可用资源
DWS MCP Server 通过 MCP 暴露以下资源:
- gaussdb:////{schema}/tables
列出指定模式下的所有表 - gaussdb:///{schema}/views
列出指定模式下的所有视图 - gaussdb:///{schema}/{table}/attributes
列出指定表/视图所有的列 - system:///{system_path}
系统信息(例如 /version)
3. Agent搭建及server配置
以下使用Cline作为客户端演示如何配置使用DWS MCP Server。可根据需求选择其他支持MCP的客户端,如Claude Desktop等
3.1 环境准备
- 确保DWS集群版本支持psycopg2库
- 确保使用环境python版本为3.10及以上
- 确保安装uv版本0.6.7及以上
- 安装VS Code客户端并安装Cline插件
3.2 下载 DWS MCP Server源码
从github下载源码
git clone https://github.com/HuaweiCloudDeveloper/mcp-server.git
说明:DWS MCP Server源码位于目录 huaweicloud_dws_mcp_inner 下,请在客户端配置步骤中使用该目录的路径进行配置
3.3 客户端配置
在所使用的的客户端中对模型API及MCP设定进行配置,使客户端能够正确识别连接DWS MCP Server及相关接口
- 进入Cline设置界面,根据自身使用情况在API Configuration页面下填入API Provider、API Key等信息
- 点击Cline页面右上角MCP图标进入MCP配置界面并点击Installed页签,在下方点击Configure MCP Servers,并填入以下DWS MCP Server配置
{
"mcpServers": {
"DWS": {
"disabled": false,
"timeout": 60,
"type": "stdio",
"command": "uv",
"args": [
"--directory",
"/path/to/huaweicloud_dws_mcp_inner",
"run",
"server.py"
],
"env": {
"DB_HOST": "host_ip",
"DB_PORT": "port_no",
"DB_NAME": "database",
"DB_USER": "username",
"DB_PWD": "password"
}
}
}
}
参数说明:将env中对应字段值替换为集群需要连接的节点对应的信息
/path/to/huaweicloud_dws_mcp_inner" 替换为huaweicloud_dws_mcp_inner目录所在路径
host_ip 替换为集群实际ip地址
port_no 替换为实际端口号
database 替换为需要连接的数据库名
username 替换为需要连接的用户名
password 替换为上述用户的密码
如果因网络问题无法使用uv,可以通过python启动server,步骤如下:
- 在源码目录下通过pip安装dws-mcp-server
pip install .
- 将cline的mcp server配置更换为:
{
"mcpServers": {
"DWS": {
"disabled": false,
"timeout": 60,
"type": "stdio",
"command": "python",
"args": [
"/path/to/huaweicloud_dws_mcp_inner/src/server.py",
],
"env": {
"DB_HOST": "host_ip",
"DB_PORT": "port_no",
"DB_NAME": "database",
"DB_USER": "username",
"DB_PWD": "password"
}
}
}
}
/path/to/huaweicloud_dws_mcp_inner/src/server.py 替换为 DWS MCP Server 源码中server.py的完整路径。
保存配置信息后,观察cline mcp页面是否成功加载DWS mcp server,若如下图能够加载DWS server及显示对应工具及资源说明配置成功
3.4 DWS集群配置
DWS MCP Server通过 Psycopg2 连接集群,需要对集群进行如下配置确保网络连接畅通
- 编辑集群安装目录下CN节点的
pg_hba.conf配置文件,添加以下配置信息将客户端所在环境添加为host - 修改GUC参数password_encryption_type的值为1,在
pg_hba.conf中将上述新增的host加密算法更改为md5,修改后需重启数据库并重新设置用户密码,以使新密码采用 MD5 算法存储。 - 编辑postgresql.conf文件,将客户端所在环境的ip地址增加至
listen_addresses
host <允许访问的库> <允许的用户名> <客户端ip/掩码> <加密算法>
- 修改GUC参数password_encryption_type的值为1,在
pg_hba.conf中将上述新增的host加密算法更改为md5,修改后需重启数据库并重新设置用户密码,以使新密码采用 MD5 算法存储。 - 编辑postgresql.conf文件,将客户端所在环境的ip地址增加至
listen_addresses
listen_addresses = 'localhost,<client_ip>'
集群环境可通过设置GUC参数完成上述配置:
gs_guc set -N all -I all -Z coordinator -c "listen_addresses='*'" gs_guc set -N all -I all -Z coordinator -h "host all all 0.0.0.0/0 md5" gs_guc reload -Z coordinator -Z datanode -N all -I all -c "password_encryption_type=1"
4 开始体验
完成客户端及集群相关配置后,开始搭建以DWS + MCP + LLM为核心的数据分析工作流。以下以cline为客户端进行演示。
根据tpcds相关表的数据,对1998-2002年间的销售情况进行一系列分析并提出洞察与建议,最终交付数据分析报告。
DWS + MCP server为LLM提供了准确的数据来源,依赖模型的推理和分析能力,我们可以在无需手动编写SQL查询语句的情况下获取数据,用自然语言一键式完成查询,并进一步借助LLM对数据进行初步的分析和洞悉。
回答内容与风格取决于模型能力,示例仅作为参考
1. 在cline的对话框中输入需要完成的数据分析任务的promt
2. 发送任务后,cline会调用模型并依据推理结果发起一系列tools或resource的调用请求。观察请求主体并选择同意(可以按需开启自动同意执行)
- 模型解析任务并生成plan
- 调用工具获取元数据信息
- 根据元数据推理并生成查询,获取具体数据
3. 通过一系列与DWS的交互以及获取的查询结果进行分析,最终呈现结果
- 生成报告
![]()
![]()
![]()
![]()
- 输出总结
![]()
5 总结
通过搭建 DWS‑MCP‑Server,企业与科研团队即可将自然语言对话与关系数据库无缝衔接,实现“一键查询、自动化报表、动态分析”的全链路数据服务。按手册步骤完成配置后,LLM 将直接识别工具接口(如 list_databases、execute_query 等),在安全约束内调用接口进行 SQL 生成与执行。元数据查询(schema、tables、views)与业务查询结果无缝串联,随后模型可立即进行业务解读、可视化图表与洞察报告的自动生成。该方案不仅显著降低了传统 SQL 开发的学习曲线和运维成本,还提升了数据迭代的响应速度,为数据驱动决策提供了高度可靠且易扩展的技术平台。在自然语言接口与 AI 推理能力进一步成熟的今天,DWS‑MCP‑Server 能够成为企业数据治理、实时分析与跨团队协作的巨大助力。





浙公网安备 33010602011771号