2013年2月2日

基于ASP.NET的lucene.net全文搜索(二)

摘要: 在上一篇博客中写了如何对txt文件进行全文搜索,也阐述了我对lucene.net全文搜索的理解,核心就是提取出各个格式文档的文本内容。这一篇中将写如何获取word、ppt、excel、pdf格式文档的内容。对于lucene.net全文搜索的框架和代码不再赘述,需要请看基于ASP.NET的lucene.net全文搜索(一)还是按照由简到难的顺序来进行。1.首先是读取word文档内容。读取word文档内容,首先要在工程中添加引用Microsoft.Vbe.Interop.dllMicrosoft.Office.Interop.Word.dll其次在代码中添加命名空间using Microsoft. 阅读全文

posted @ 2013-02-02 11:57 Roc.Sun 阅读(923) 评论(1) 推荐(1) 编辑

导航