摘要: 本文介绍如何通过apache tika从文档(pdf、doc、docx、txt)中 提取特征数据,比如文档中有身份证、姓名等信息。【全部是经本人实际测试过的功能】 1、需引入相关pom依赖 <!-- apache tika 包,用于解析pdf、word文本文档--> <dependency> <gr 阅读全文
posted @ 2025-04-23 11:17 咖啡因依赖症患者 阅读(244) 评论(0) 推荐(0)