Apache tica详述
摘要:
Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI,Pdfbox并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展API,用来丰富其对第三方文件格式的支持。在当前的0.2-SNAPSHOT版本中, Tika提供了对如下... 阅读全文
posted @ 2015-05-09 22:05 nevergiveupzeng 阅读(554) 评论(0) 推荐(0)