miketwais

work up

Dify 工作流实践--PDF工商信息识别(进阶版本,接入本地知识库识别代码)

接前面一篇文章,完成PDF中图片中文字的识别

今天的场景中,我们会根据自己定义的标准(可能是国标,或者欧标等,因为各个地区表准不一样),进行分类识别,这里引入本地知识库查询

自己定义出分类标准

看看流程:

 增加了知识库:

注意:当我们想要用关键字检索时(文本匹配),请将knowlage retrive配置改为:

 增大关键字匹配的权重,经测试效果非常好(类似于文本匹配)

关于knowlage base的配置:

 选择embedding和rerank模型:

 

文本知识库格式Excel:

 执行效果:

 分享DSL

 

posted @ 2025-06-13 21:45  MasonZhang  阅读(317)  评论(0)    收藏  举报