TextIn文档树引擎,助力RAG知识库问答检索召回能力提升
摘要:
TextIn团队的文档解析测评工具Markdown Tester在Github发布后,我们陆续与大家探讨了目前业内对PDF解析工作的评判标准与我们各项测评指标的设计原理,包括段落、表格、公式、阅读顺序等维度。
今天,我们将介绍另一项重要指标,也是业内面对的一项普遍性难点:标题识别,以及它如何影响数据清洗与RAG系统开发。 阅读全文
posted @ 2024-08-13 11:05 合合技术团队 阅读(125) 评论(0) 推荐(0)
浙公网安备 33010602011771号