nl2sql 开发笔记
数据库问答
文件解析
以excel文件为主,当前支持解析的布局类型:
- 单表:多层级横向表头+数据,如:
| | age | _ | salary |
|---|---|---|
| age | name | _ |
| 18 | meme | 199 |
存储到sqlite数据库,每个文件的sheet(工作表)视为一张表,存储表名、表描述、表头字段名、字段类型、字段描述
表名: 文件名+工作表命名拼音缩写
不足:相当于打平多个文件的多张表,实际应该还要存储文件的描述,从而充分对数据进行摘要,可能可以用于召回时先筛选文件再筛选表
召回
ReAct形式,给定表schema从而选择相关的表
不足: 存在理解语义欠缺
参考
https://www.reddit.com/r/LangChain/comments/1e5pe1a/optimal_rag_for_text2sql/

浙公网安备 33010602011771号