摘要: 本节介绍了Field的boost如何设置,以及如何有效调整权重的一些经验之谈。 阅读全文
posted @ 2008-09-09 18:06 Birdshover 阅读(6561) 评论(21) 推荐(5) 编辑
摘要: 本节从感性入手,从实验上分析,权重增长多少合适,增长会对其他文档得分产生什么样的影响。 阅读全文
posted @ 2008-09-06 00:54 Birdshover 阅读(6509) 评论(5) 推荐(0) 编辑
摘要: 本节开始介绍,索引中设置权重对于搜索结果的影响,内容可能需要持续几节。将主要讲述,设置权重的最小量是多少比较好;分别用Field与Document设置权重的;多Field搜索时权重又会起到什么样的最用。这个话题太大了,冷汗一下。 阅读全文
posted @ 2008-09-05 22:40 Birdshover 阅读(7781) 评论(11) 推荐(3) 编辑
摘要: 本节详细介绍了索引过程中,不同的Field配置会产生的各种情况。 阅读全文
posted @ 2008-09-03 22:27 Birdshover 阅读(9035) 评论(8) 推荐(2) 编辑
摘要: NLuke是参照Luke(lukeall)的功能开发的Lucene索引管理工具,NLuke是用C#开发的基于.Net Framework运行的程序. 阅读全文
posted @ 2008-09-03 15:26 Birdshover 阅读(7930) 评论(10) 推荐(0) 编辑
摘要: 本节介绍了Lucene.Net索引过程中的核心类,以及数据的流动路线。 阅读全文
posted @ 2008-09-02 01:45 Birdshover 阅读(9537) 评论(13) 推荐(6) 编辑
摘要: 本节简单介绍了索引是什么?为什么要索引?以及Lucene.Net的逻辑存储结构。后面的小节将会围绕怎么索引展开。 阅读全文
posted @ 2008-09-01 02:13 Birdshover 阅读(11212) 评论(17) 推荐(5) 编辑
摘要: 作为分词在一个阶段的结束篇,总感觉有点虎头蛇尾的味道。而如果现在讲基于词库,语言方面的分词感觉还是早了点,因此,这里就匆匆收笔,准备进入索引部分的探索。本节主要对比了一下Lucene.Net2.1前版和2.3.1版本在分词上的一个最主要的差别, 介绍了怎么修改。然后简单分析了下二元分词的优点和不足。 阅读全文
posted @ 2008-08-31 05:33 Birdshover 阅读(7273) 评论(12) 推荐(2) 编辑
摘要: 本节介绍了如何开发自己的分词器,介绍了二元分词器的开发。因为版本的更新,需要对一些地方进行修改,下一节会对版本更新后导致问题做一个大致的分析。 阅读全文
posted @ 2008-08-31 00:51 Birdshover 阅读(9864) 评论(34) 推荐(2) 编辑
摘要: 本节介绍了StandardAnalyzer分词器如何使用能达到我们的目的,原来StandardAnalyzer分词器也不是我们想的那么差啊! 阅读全文
posted @ 2008-08-29 22:32 Birdshover 阅读(8529) 评论(18) 推荐(2) 编辑
摘要: 本篇介绍了Lucene.Net内置分词器的整体结构,和调用的流程。接着介绍了如何写最简单的分词器。 阅读全文
posted @ 2008-08-29 02:21 Birdshover 阅读(8104) 评论(15) 推荐(1) 编辑
摘要: 本篇介绍Lucene.Net的分词过程,分析最懒惰的什么也不做的KeywordAnalyzer分词器和只用空格分词的WhitespaceAnalyzer分词器。然后粗略得到Lucene.Net的分词流程和如何简单的分词,这些是自己写分词器的基础。 阅读全文
posted @ 2008-08-28 23:41 Birdshover 阅读(13435) 评论(22) 推荐(3) 编辑
摘要: 本篇介绍了如何测试分词器的效果,并且简单测试了一下Lucene.Net内置分词器的效果。 阅读全文
posted @ 2008-08-27 00:33 Birdshover 阅读(14661) 评论(36) 推荐(4) 编辑
摘要: Lucene.Net 2.3.1开发介绍 —— 简介 Lucene.Net 2.3.1开发介绍 —— 一、接触Lucene.Net Lucene.Net 2.3.1开发介绍 —— 二、分词(一) 本篇介绍了如何测试分词器的效果,并且简单测试了一下Lucene.Net内置分词器的效果。Lucene.Net 2.3.1开发介绍 —— 二、分词(二) 本篇介绍Lucene.Net的分词过程,分析最懒惰的... 阅读全文
posted @ 2008-08-26 23:20 Birdshover 阅读(19494) 评论(18) 推荐(9) 编辑
摘要: 1、引用Lucene.Net类库找到Lucene.Net的源代码,在“C#\src\Lucene.Net”目录。打开Visual Studio,我的版本是2008,而Lucene.Net默认的是2005。先创建一个项目,简单起见,创建一个C#控制台程序。 图 1.1 然后添加Lucene.Net进项目,如图 1.2 - 1.3。 图 1.2图 1.3 这个过程要进行一个VS2005到2008的转换... 阅读全文
posted @ 2008-08-26 22:34 Birdshover 阅读(21386) 评论(31) 推荐(7) 编辑
摘要: 首先,你需要一个svn客户端。TortoiseSVN非常好用,可以从官方网站下载。下载地址:http://tortoisesvn.net/downloads。下载完成,就安装,需要重启电脑。然后在d盘下建立一个空文件夹,命名为Lucene.Net。打开文件夹,右键,则出现菜单。如图"附录一 1"。 附录一 1 发现多了两项,分别是SVN Checkout和TortoiseSVN。点“SVN Che... 阅读全文
posted @ 2008-08-26 21:03 Birdshover 阅读(21878) 评论(17) 推荐(3) 编辑
摘要: Lucene.Net是Lucene在dot net平台上的移植版本。它的功能与Lucene一样,都是用来提供一组API,让我们能快速开发自己的搜索引擎,当然,是全文搜索。它不是一个程序,拿到它并不能立刻运行,你必须自己实现逻辑过程。这是一个和.Net Framework一样的框架。Lucene是用Java写的,尔后衍生出Nutch,接着又衍生出Hadoop。这些可以说和Lucen... 阅读全文
posted @ 2008-08-26 20:46 Birdshover 阅读(18440) 评论(13) 推荐(2) 编辑
摘要: 在使用Lucene的过程中,对Lucene的工作方式产生了越来越浓厚的兴趣。于是尝试阅读其中所有的类,整理其内部结构关系,以期能理解Lucene。 阅读全文
posted @ 2008-08-07 22:19 Birdshover 阅读(6479) 评论(3) 推荐(2) 编辑
摘要: 假如变量的值 i = int.MaxValue;这个时候运行;Console.WriteLine(++i);输出什么?其他书上也有讲,只是可能没有讲这么多废话。 阅读全文
posted @ 2008-08-05 22:17 Birdshover 阅读(4272) 评论(4) 推荐(0) 编辑
摘要: 这样就总结出三种for循环样式 1、for(int i = 0;i 0 || j0 ; i--,j++) //有多表达式的 还有.... 阅读全文
posted @ 2008-08-04 23:05 Birdshover 阅读(213574) 评论(31) 推荐(5) 编辑
摘要: (2008年7月31日 9:07:39 修正。)假如能自己判断出要添加的大概数量的话,List最好是预先分配大小了。预先分配大小,分配多少就是多少个。预先分配的大小一定要大于等于加进去的元素数量。否则,说不定比不分配更加糟糕。 要是用List分配空间的方式来理解Dictionary,那就又错了。Dictionary有它自己的分配方式。 阅读全文
posted @ 2008-07-31 00:59 Birdshover 阅读(9692) 评论(12) 推荐(0) 编辑
摘要: SharpCached是完全用C#开发的,基于.Net Framework 2.0运行的内存缓存服务。 阅读全文
posted @ 2008-07-29 23:28 Birdshover 阅读(3032) 评论(21) 推荐(0) 编辑
摘要: 一、如果在a.com访问后,登陆,然后再访问b.com,如何保证这个时候b.com是登陆状态? 二、我已经有了3个系统,现在做了个passport,怎么整进去才好? 阅读全文
posted @ 2008-05-16 11:51 Birdshover 阅读(2115) 评论(4) 推荐(0) 编辑
摘要: 可以自己看看是不是很高效。为了加快速度,尽量精简了算法。测试表明,精确度还可以。 由于没有实现完整的一套字典机制,而是普通的文本字典,所以就不提供完整源码下载了,贴出核心的源码。 阅读全文
posted @ 2008-03-25 01:32 Birdshover 阅读(8978) 评论(10) 推荐(0) 编辑
摘要: 这件事情似乎很无聊,但是没人做,我来做下苦力吧。一、ArrayList (100W,1W),二、Hashtable (100W,1W),三、HashSet (100W,100W),四、List (100W,1W),五、Dictionary (100W,100W),六、Dictionary Linq查询 (100W,100W) 阅读全文
posted @ 2008-03-19 23:31 Birdshover 阅读(4121) 评论(23) 推荐(0) 编辑
摘要: 控制台程序足够简洁,但是,经常会点错而误关闭。而且,如果系统关闭,或者用户注销,这时候任务还没完成的话,前面的运算电费就白出了。 有没有办法和WinForm一样,对控制台的退出事件进行控制呢?有的! 阅读全文
posted @ 2008-03-17 16:48 Birdshover 阅读(10761) 评论(7) 推荐(2) 编辑
摘要: 本文是用IHttpModule解决输入中文地址乱码问题(一) 的续文。上文说到,需要对已有的地址进行GB2312编码,这样大大增加了工作量,有没更好的办法呢? 1 public class HookModule : IHttpModule 2 { 3 4 #region IHttpModule 成员 5 6 public void Dispos... 阅读全文
posted @ 2008-03-14 18:52 Birdshover 阅读(2947) 评论(1) 推荐(0) 编辑
摘要: 测试环境: 服务器 —— [本机] WIindows2003 Enterprise Edition 2003 sp2 ,IIS 6.0,IE 7.0,ASP.NET 2.0 客户端 —— [本机] 同上,Firefox 2.0.0.12 阅读全文
posted @ 2008-03-06 00:02 Birdshover 阅读(4713) 评论(6) 推荐(0) 编辑
摘要: 本文将重点描述,MVC框架中默认的地址重写。 阅读全文
posted @ 2008-01-18 22:57 Birdshover 阅读(5518) 评论(9) 推荐(2) 编辑
摘要: 前几年的时候ASP.Net就有MVC的概念,实际上就是我们熟悉的WebForm开发模型。 而今,微软推出了新的MVC开发框架,也就是Microsoft ASP.NET 3.5 Extensions。 阅读全文
posted @ 2008-01-18 01:11 Birdshover 阅读(16396) 评论(18) 推荐(1) 编辑