摘要: 本节从感性入手,从实验上分析,权重增长多少合适,增长会对其他文档得分产生什么样的影响。
阅读全文
摘要: 本节开始介绍,索引中设置权重对于搜索结果的影响,内容可能需要持续几节。将主要讲述,设置权重的最小量是多少比较好;分别用Field与Document设置权重的;多Field搜索时权重又会起到什么样的最用。这个话题太大了,冷汗一下。
阅读全文
摘要: 本节详细介绍了索引过程中,不同的Field配置会产生的各种情况。
阅读全文
摘要: NLuke是参照Luke(lukeall)的功能开发的Lucene索引管理工具,是用C#开发的基于.Net Framework运行的程序。
阅读全文
摘要: NLuke是参照Luke(lukeall)的功能开发的Lucene索引管理工具,NLuke是用C#开发的基于.Net Framework运行的程序.
阅读全文
摘要: 本节介绍了Lucene.Net索引过程中的核心类,以及数据的流动路线。
阅读全文
摘要: 本节简单介绍了索引是什么?为什么要索引?以及Lucene.Net的逻辑存储结构。后面的小节将会围绕怎么索引展开。
阅读全文
摘要: 作为分词在一个阶段的结束篇,总感觉有点虎头蛇尾的味道。而如果现在讲基于词库,语言方面的分词感觉还是早了点,因此,这里就匆匆收笔,准备进入索引部分的探索。本节主要对比了一下Lucene.Net2.1前版和2.3.1版本在分词上的一个最主要的差别, 介绍了怎么修改。然后简单分析了下二元分词的优点和不足。
阅读全文
摘要: 本节介绍了如何开发自己的分词器,介绍了二元分词器的开发。因为版本的更新,需要对一些地方进行修改,下一节会对版本更新后导致问题做一个大致的分析。
阅读全文
摘要: 本节介绍了StandardAnalyzer分词器如何使用能达到我们的目的,原来StandardAnalyzer分词器也不是我们想的那么差啊!
阅读全文
摘要: 本篇介绍了Lucene.Net内置分词器的整体结构,和调用的流程。接着介绍了如何写最简单的分词器。
阅读全文
摘要: 本篇介绍Lucene.Net的分词过程,分析最懒惰的什么也不做的KeywordAnalyzer分词器和只用空格分词的WhitespaceAnalyzer分词器。然后粗略得到Lucene.Net的分词流程和如何简单的分词,这些是自己写分词器的基础。
阅读全文
摘要: 本篇介绍了如何测试分词器的效果,并且简单测试了一下Lucene.Net内置分词器的效果。
阅读全文
摘要: 在使用Lucene的过程中,对Lucene的工作方式产生了越来越浓厚的兴趣。于是尝试阅读其中所有的类,整理其内部结构关系,以期能理解Lucene。
阅读全文
摘要: 假如变量的值 i = int.MaxValue;这个时候运行;Console.WriteLine(++i);输出什么?其他书上也有讲,只是可能没有讲这么多废话。
阅读全文
摘要: 这样就总结出三种for循环样式
1、for(int i = 0;i < 100;i++) //递减和递加的算一种
2、for(;true;) //有空表达式的
3、for (int i = 100, j = 100; i > 0 || j>0 ; i--,j++) //有多表达式的
还有....
阅读全文
摘要: (2008年7月31日 9:07:39 修正。)假如能自己判断出要添加的大概数量的话,List最好是预先分配大小了。预先分配大小,分配多少就是多少个。预先分配的大小一定要大于等于加进去的元素数量。否则,说不定比不分配更加糟糕。
要是用List分配空间的方式来理解Dictionary,那就又错了。Dictionary有它自己的分配方式。
阅读全文
摘要:
SharpCached是完全用C#开发的,基于.Net Framework 2.0运行的内存缓存服务。
阅读全文