摘要:
Tika入门 Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展API,用来丰富其对第三方文件格式的支持。 在当前版本中,Tika提供了对如下文件格式 阅读全文
posted @ 2017-03-14 18:16 季枫 阅读(230) 评论(0) 推荐(0) 编辑
摘要:
Tika入门 Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展API,用来丰富其对第三方文件格式的支持。 在当前版本中,Tika提供了对如下文件格式 阅读全文
posted @ 2017-03-14 18:16 季枫 阅读(230) 评论(0) 推荐(0) 编辑 |
||