嵌入式数据库
关系型数据库 sqlite
OLAP 数据库 duckdb
图数据库 kuzu
Kuzu 正在开发新项目! 将不再积极支持 KuzuDB
Kùzu为嵌入式数据库
Embedded property graph database built for speed. Vector search and full-text search built in. Implements Cypher.
发布时间:2022 11月15 Nov 15, First release
v0.11.2
embedded graph database 嵌入式图数据库
The easiest way to manage knowledge graphs and vectors.
图数据库查询
GQL Graph Query Language
Neo4j 的 Cypher,Oracle 的 PGQL 和 TigerGraph 的 GSQL
neo4j是开源的nosql图形数据库,使用scala和java语言,2007年开始发布
Nodes:节点,代表实体,。
Relationship: 关系,即代表图中的边,Relationship 连接两个节点,使得组织成列表、树、图等更为复杂的结构。
关系具有方向:单向和双向
Labels: 标签,代表 Node/节点/实体 属于哪一个集体,每一个 Node/节点/实体 可以有 0 个或多个标签。
标签也可以在运行时添加,所以标签也可以描述节点的状态信息。
Properties:属性,即描述 Node/节点 或者 Relationship/关系 的属性。
Schema: 模式,在 Neo4J 中是可选的,即可以不预先定义一个 schema 而直接产生数据,
Cypher 是 Neo4j 图数据库的查询语言
是一种声明式的图数据库查询语言 ()代表节点, [] 代表关系
WHERE、ORDER BY、SKIP 和 LIMIT 就来源于关系数据库查询语言 SQL
基本命令和语法
match 命令 匹配(查询)已有数据
merge 命令 merge 命令: 若节点存在, 则等效与 match 命令; 节点不存在, 则等效于 create 命令
relationship 关系命令
where 命令
create 命令
delete 命令
sort 命令
字符串函数
remove 命令:删除标签和属性
聚合函数
index 索引命令
数据库观点
PostgreSQL 成为香饽饽,已是新应用程序的首选
向量数据库
向量数据库 主题搜索所依赖的“魔法”是 transformer 本质上,向量数据库只是一个带有特定索引数据结构的文档数据库,以加速对嵌入的相似性搜索。
MCP Model Context Protocol (MCP),
RAG(Retrieval Augmented Generation)
Kuzu-mcp-server 是一个为 Kuzu 数据库提供查询和模式检查功能的协议服务器。
LIN是 Local Interconnect Network
CAN/FlexRay汽车总线ASC标准格式说明
CAN FD(Flexible Data-rate)
构建图数据库-数据
spaCy 本身没有从文本中提取关系和实体的工具。
Gliner 和 Glirel
个是用于从文本中提取命名实体,另一个是用于从文本中提取显式关系。
插入到底层的 spaCy 分词器和底层的 spaCy 数据表示中
使用 spaCy + Gliner + Glirel 从文本中提取图数据
使用 LLM 提取数据
H2、HSQLDB和Derby
参考
https://blog.kuzudb.com/
https://github.com/kuzudb/kuzu
探索Kùzu:高效处理海量数据的嵌入式图数据库及其LLM集成应用 https://juejin.cn/post/7448955277086375976