Dify 工作流实践--PDF工商信息识别(进阶版本，接入本地知识库识别代码)

接前面一篇文章，完成PDF中图片中文字的识别

今天的场景中，我们会根据自己定义的标准（可能是国标，或者欧标等，因为各个地区表准不一样），进行分类识别，这里引入本地知识库查询

自己定义出分类标准

看看流程：

增加了知识库：

注意：当我们想要用关键字检索时（文本匹配），请将knowlage retrive配置改为：

增大关键字匹配的权重，经测试效果非常好（类似于文本匹配）

关于knowlage base的配置：

选择embedding和rerank模型：

文本知识库格式Excel：

执行效果：

分享DSL

posted @ 2025-06-13 21:45 MasonZhang 阅读(411) 评论(0) 收藏举报

刷新页面返回顶部

miketwais