摘要: 最近在做一个附件的全文搜索功能,做这个功能首先要解决的问题就是把文档的文本信息全部提取出来,现在使用的是使用对文档进行编程的方式来提取文本,每种文档类型需要特别写一个程序来提取相应的文本。最近发现在在 WINDOWS 里有一个自带的虚拟打印机,把文档打印到这个打印机的时候,会生成一个文件,这个文件中的内容全是文档的文本信息。添加打印机:在打印机管理中,点击添加打印机, 在第一步中选择“... 阅读全文
posted @ 2010-11-30 10:24 匡匡 阅读(452) 评论(0) 推荐(0)