会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
桃李满园
博客园
首页
新随笔
联系
订阅
管理
2025年4月23日
通过apache tika从文档(pdf、doc、docx、txt)中 提取特征数据
摘要: 本文介绍如何通过apache tika从文档(pdf、doc、docx、txt)中 提取特征数据,比如文档中有身份证、姓名等信息。【全部是经本人实际测试过的功能】 1、需引入相关pom依赖 <!-- apache tika 包,用于解析pdf、word文本文档--> <dependency> <gr
阅读全文
posted @ 2025-04-23 11:17 咖啡因依赖症患者
阅读(244)
评论(0)
推荐(0)
公告