摘要: 现象:用fast search搜索的时候发现如下现象使用“土地工农费用、征地费用、地籍费用管理业务”无法搜索到结果。容易使对搜索结果产生怀疑,明明在数据库总有这样的数据呀。发现:使用“土地 工农 费用 征地 费用 管理 业务”搜索可以搜索到结果。其实这样就可以很容易看出来,原理是分词的原因。分词的好坏决定了搜索的质量。在 FAST Search Server 2010 for SharePoint 中,您可以使用两种方法影响默认词汇切分:语言词汇切分和子字符串词汇切分。语言词汇切分语言词汇切分表示根据特定语言规则将一个文本字符串拆分为单个标记。对于东亚语言,可通过创建自定义词典来影响词汇切分。 阅读全文
posted @ 2012-03-27 14:29 jindahao 阅读(613) 评论(0) 推荐(0)
摘要: 爬网日志:对 LOB 内容进行爬网时出错。 (Database Connector has throttled the response. The response from database contains more than '2000' rows. The maximum number of rows that can be read through Database Connector is '2000'. The limit can be changed via the 'Set-SPBusinessDataCatalogThrottleCo 阅读全文
posted @ 2012-03-27 09:50 jindahao 阅读(337) 评论(0) 推荐(0)