2013年4月16日

摘要: 使用PDFBOX 对pdf文件进行解析时 常报一些 for input string:"" 错误 ,因为pdf文件中含有某些字符串无法转换之类导致的,没有啥办法解决.如果使用 HBTextParse对PDF文件进行解析的话 没有PDFBOX之类的错误了,问题解决. 但需安装Adobe PDF IFilter6.0 或更高版本。感谢作者 :eaglethttp://www.cnblogs.com/eaglet/archive/2013/01/10/2854224.html#2614415 阅读全文
posted @ 2013-04-16 12:36 ——阿文 阅读(227) 评论(0) 推荐(0)
摘要: =================多目录搜索 ============// 我们可以使用 MultiReader 或 MultiSearcher 搜索多个索引库。//string indexPath = @"D:\IndexFilePath"; //string indexPath2 = @"D:\IndexFilePath2"; //MultiReader reader = new MultiReader(new IndexReader[] { IndexReader.Open(indexPath), IndexReader.Ope... 阅读全文
posted @ 2013-04-16 11:25 ——阿文 阅读(453) 评论(0) 推荐(0)
摘要: ============本文转自==========http://job-love.blog.sohu.com/97319481.html================================Lucene.net是目前在.net环境中被普遍使用的全文索引的开源项目,这次在项目的开发中也使用它进行全文索引。在开发过程中碰到一些小问题就是对多字段和多索引目录进行搜索。1、多字段搜索就是同时要一个以上的字段中的内容进行比较搜索,类似概念在SQL中就是select * from Table where a like '%query%' or b like '%quer 阅读全文
posted @ 2013-04-16 09:59 ——阿文 阅读(245) 评论(0) 推荐(0)

导航