08 2008 档案

摘要: 作为分词在一个阶段的结束篇,总感觉有点虎头蛇尾的味道。而如果现在讲基于词库,语言方面的分词感觉还是早了点,因此,这里就匆匆收笔,准备进入索引部分的探索。本节主要对比了一下Lucene.Net2.1前版和2.3.1版本在分词上的一个最主要的差别, 介绍了怎么修改。然后简单分析了下二元分词的优点和不足。阅读全文
posted @ 2008-08-31 05:33 Birdshover 阅读(5135) | 评论 (11) 编辑
摘要: 本节介绍了如何开发自己的分词器,介绍了二元分词器的开发。因为版本的更新,需要对一些地方进行修改,下一节会对版本更新后导致问题做一个大致的分析。阅读全文
posted @ 2008-08-31 00:51 Birdshover 阅读(6704) | 评论 (28) 编辑
摘要: 本节介绍了StandardAnalyzer分词器如何使用能达到我们的目的,原来StandardAnalyzer分词器也不是我们想的那么差啊!阅读全文
posted @ 2008-08-29 22:32 Birdshover 阅读(5667) | 评论 (16) 编辑
摘要: 本篇介绍了Lucene.Net内置分词器的整体结构,和调用的流程。接着介绍了如何写最简单的分词器。阅读全文
posted @ 2008-08-29 02:21 Birdshover 阅读(5336) | 评论 (14) 编辑
摘要: 本篇介绍Lucene.Net的分词过程,分析最懒惰的什么也不做的KeywordAnalyzer分词器和只用空格分词的WhitespaceAnalyzer分词器。然后粗略得到Lucene.Net的分词流程和如何简单的分词,这些是自己写分词器的基础。阅读全文
posted @ 2008-08-28 23:41 Birdshover 阅读(8603) | 评论 (19) 编辑
摘要: 本篇介绍了如何测试分词器的效果,并且简单测试了一下Lucene.Net内置分词器的效果。阅读全文
posted @ 2008-08-27 00:33 Birdshover 阅读(9264) | 评论 (33) 编辑
摘要: Lucene.Net 2.3.1开发介绍 —— 简介 Lucene.Net 2.3.1开发介绍 —— 一、接触Lucene.Net Lucene.Net 2.3.1开发介绍 —— 二、分词(一) 本篇介绍了如何测试分词器的效果,并且简单测试了一下Lucene.Net内置分词器的效果。Lucene.Net 2.3.1开发介绍 —— 二、分词(二) 本篇介绍Lucene.Net的分词过程,分析最懒惰的...阅读全文
posted @ 2008-08-26 23:20 Birdshover 阅读(12587) | 评论 (18) 编辑
摘要: 在使用Lucene的过程中,对Lucene的工作方式产生了越来越浓厚的兴趣。于是尝试阅读其中所有的类,整理其内部结构关系,以期能理解Lucene。阅读全文
posted @ 2008-08-07 22:19 Birdshover 阅读(5048) | 评论 (2) 编辑
摘要: 假如变量的值 i = int.MaxValue;这个时候运行;Console.WriteLine(++i);输出什么?其他书上也有讲,只是可能没有讲这么多废话。阅读全文
posted @ 2008-08-05 22:17 Birdshover 阅读(1695) | 评论 (4) 编辑
摘要: 这样就总结出三种for循环样式 1、for(int i = 0;i < 100;i++) //递减和递加的算一种 2、for(;true;) //有空表达式的 3、for (int i = 100, j = 100; i > 0 || j>0 ; i--,j++) //有多表达式的 还有.... 阅读全文
posted @ 2008-08-04 23:05 Birdshover 阅读(21015) | 评论 (30) 编辑