SQL Server 图数据库学习笔记1:构建图数据库

SQL Server 图数据库学习笔记1:构建图数据库

摘要

在AI开发中,知识图谱是非常火的一个领域,而提到图数据库大家都会第一时间想到Neo4J,其实在SQLServer中早已有支持,此篇将简单演示如何在SQLServer下构建图数据库,实现知识图谱的管理。

最终,我们将搭建出一个如下的简单知识图谱页面:

img


SQL Server 图数据库搭建

数据库创建与配置

开始之前需要确定SQLServer安装的版本是2017之后的版本。

-- 创建支持中文的图数据库
CREATE DATABASE GraphDB
COLLATE Chinese_PRC_CI_AS;
GO

USE GraphDB;
GO

库的创建跟创建常规数据库的方法一致。


图数据库核心表结构

在SQLServer中跟Neo4J一样基本物件都是NODE和EDGE,在SQLServer中的创建方法如下:

节点表 (Nodes)

-- 使用 AS NODE 创建原生图节点表
CREATE TABLE Nodes (
    NodeType NVARCHAR(100) NOT NULL,
    Name NVARCHAR(255) NOT NULL,
    Properties NVARCHAR(MAX) DEFAULT '{}',
    CreatedAt DATETIME2 DEFAULT GETDATE(),
    UpdatedAt DATETIME2 DEFAULT GETDATE(),
    IsDeleted BIT DEFAULT 0
) AS NODE;

-- 创建索引
CREATE INDEX IX_Nodes_NodeType ON Nodes(NodeType);
CREATE INDEX IX_Nodes_Name ON Nodes(Name);

知识点笔记

  • AS NODE:将表声明为图节点表,SQL Server 自动添加 $node_id
  • $node_id:系统生成的唯一标识,格式为 JSON(如 {"type":"node","schema":"dbo","table":"Nodes","id":0}
  • 自定义列:NodeTypeNameProperties 等业务字段
  • 无需手动定义主键,SQL Server 自动管理节点 ID

边表 (Edges)

-- 使用 AS EDGE 创建原生图边表
CREATE TABLE Edges (
    EdgeType NVARCHAR(100) NOT NULL,
    Properties NVARCHAR(MAX) DEFAULT '{}',
    Weight FLOAT DEFAULT 1.0,
    CreatedAt DATETIME2 DEFAULT GETDATE(),
    UpdatedAt DATETIME2 DEFAULT GETDATE(),
    IsDeleted BIT DEFAULT 0
) AS EDGE;

-- 创建索引
CREATE INDEX IX_Edges_EdgeType ON Edges(EdgeType);

知识点笔记

  • AS EDGE:将表声明为图边表,SQL Server 自动添加 $edge_id$from_id$to_id
  • $edge_id:边的唯一标识,JSON 格式
  • $from_id:起始节点的 $node_id
  • $to_id:目标节点的 $node_id
  • 方向性:边是有向的,$from_id 指向 $to_id
  • 无需外键约束,原生图自动维护引用完整性

创建节点和关系跟Neo4J的Cypher语句差别很大,这里需要留意。


测试数据生成

插入节点数据

-- 人物节点
INSERT INTO Nodes (NodeType, Name, Properties)
VALUES
    ('Person', '张三', '{"age": 35, "occupation": "工程师", "city": "北京"}'),
    ('Person', '李四', '{"age": 42, "occupation": "CEO", "city": "深圳"}'),
    ('Person', '王五', '{"age": 28, "occupation": "产品经理", "city": "杭州"}');

-- 公司节点
INSERT INTO Nodes (NodeType, Name, Properties)
VALUES
    ('Company', '腾讯科技', '{"founded_year": 1998, "industry": "互联网"}'),
    ('Company', '阿里巴巴', '{"founded_year": 1999, "industry": "电子商务"}'),
    ('Company', '字节跳动', '{"founded_year": 2012, "industry": "科技"}');

插入边关系数据 - 使用原生图语法

-- 工作关系:使用 $from_id 和 $to_id 插入边
INSERT INTO Edges ($from_id, $to_id, EdgeType, Properties)
SELECT n1.$node_id, n2.$node_id, 'WORKS_AT', '{"department": "技术部", "start_year": 2020}'
FROM Nodes n1, Nodes n2
WHERE n1.Name = '张三' AND n2.Name = '腾讯科技';

INSERT INTO Edges ($from_id, $to_id, EdgeType, Properties)
SELECT n1.$node_id, n2.$node_id, 'FOUNDED', '{"role": "创始人"}'
FROM Nodes n1, Nodes n2
WHERE n1.Name = '李四' AND n2.Name = '阿里巴巴';

知识点笔记

  • 使用 $from_id$to_id 指定边的起始和目标节点
  • 通过子查询从已有节点获取 $node_id
  • 边类型命名采用大写蛇形命名法,保持一致性
  • JSON 属性字段支持灵活扩展

复杂关系网络构建

-- 产品节点
INSERT INTO Nodes (NodeType, Name, Properties)
VALUES
    ('Product', '微信', '{"launch_year": 2011, "category": "社交"}'),
    ('Product', '淘宝', '{"launch_year": 2003, "category": "电商"}');

-- 产品归属关系
INSERT INTO Edges ($from_id, $to_id, EdgeType, Properties)
SELECT n1.$node_id, n2.$node_id, 'PRODUCES', '{}'
FROM Nodes n1, Nodes n2
WHERE n1.Name = '腾讯科技' AND n2.Name = '微信';

INSERT INTO Edges ($from_id, $to_id, EdgeType, Properties)
SELECT n1.$node_id, n2.$node_id, 'PRODUCES', '{}'
FROM Nodes n1, Nodes n2
WHERE n1.Name = '阿里巴巴' AND n2.Name = '淘宝';

图数据库查询实战

查询节点及其邻居 - MATCH 语法

-- 使用 MATCH 语法查询张三的直接关系
SELECT 
    n1.Name AS source_name,
    e.EdgeType,
    n2.Name AS target_name
FROM Nodes n1, Edges e, Nodes n2
WHERE MATCH(n1-(e)->n2)
    AND n1.Name = '张三';

知识点笔记:

  • MATCH 语法:SQL Server 原生图查询语法
  • n1-(e)->n2:表示从 n1 通过边 e 指向 n2
  • 方向性:-> 表示有向边从 n1 到 n2
  • 无需 JOIN 关键字,路径关系在 MATCH 中声明

多跳路径查询

-- 查询张三所属公司的产品(两跳查询)
SELECT 
    n1.Name AS person_name,
    n2.Name AS company_name,
    n3.Name AS product_name
FROM Nodes n1, Edges e1, Nodes n2, Edges e2, Nodes n3
WHERE MATCH(n1-(e1)->n2-(e2)->n3)
    AND n1.Name = '张三'
    AND e1.EdgeType = 'WORKS_AT'
    AND e2.EdgeType = 'PRODUCES';

知识点笔记:

  • MATCH 支持多跳路径:n1-(e1)->n2-(e2)->n3
  • 在一条 MATCH 中声明完整的路径模式
  • 边类型过滤:e1.EdgeType = 'WORKS_AT'
  • 支持任意深度的路径查询

查询边的方向信息

-- 查询边的方向(入向/出向)
SELECT 
    n.Name AS node_name,
    e.EdgeType,
    CASE 
        WHEN e.$from_id = n.$node_id THEN 'outgoing'
        ELSE 'incoming'
    END AS direction
FROM Nodes n, Edges e, Nodes n2
WHERE MATCH(n-(e)->n2)
    AND (n.Name = '张三' OR n2.Name = '张三');

运行测试查询会发现SQLServer在SSMS里目前还并不像Neo4J自带的browser一样可以直接把知识图谱展现出来,目前能显示的只是常规表格数据。想要看到知识图谱效果,后续需要自己搭建对应的前端应用。


总结

使用SQLServer创建图数据库是支持的,如果已经熟悉了SQLServer那么学习的成本不会很高,而且如果已经部署了SQLServer的话,也不需要再去安装额外的东西。

使用起来跟Neo4J的差异还是很大,包括建库和插入数据。功能上虽还有差距但也基本可用。后续会继续介绍如何搭建前端应用,让知识图谱显示在页面上。

posted on 2026-05-04 00:43  哥本哈士奇(aspnetx)  阅读(0)  评论(0)    收藏  举报

导航