posts - 34, comments - 659, trackbacks - 11, articles - 0
  博客园 :: 首页 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理

2008年10月10日

     摘要: KTDictSeg 1.4.01 版本经过一段时间的紧张开发,今天正式发布。感谢这段时间一直关心这个项目的朋友们。希望我的工作能给大家带来快乐。   阅读全文

posted @ 2008-10-10 07:56 eaglet 阅读(1841) | 评论 (31)编辑

2008年10月9日

     摘要: 对于数据库的分页,目前比较传统的方法是采用分页存储过程,其实用 DataReader 也可以实现分页,不需要写存储过程,实现效率上也比几种比较流行的分页方法要略快。  阅读全文

posted @ 2008-10-09 10:02 eaglet 阅读(1929) | 评论 (21)编辑

2008年10月2日

     摘要: KTDictSeg 1.4 开发了多元分词算法,其与lucene.net 配合构建全文搜索,经测试准确度接近google和baidu的水平。现将一些实现方法和测试结果公布出来,供关心分词和搜索技术的朋友们参考。  阅读全文

posted @ 2008-10-02 16:34 eaglet 阅读(2082) | 评论 (25)编辑

2008年9月26日

     摘要: .Net framework提供了TreeView 控件,但该控件不支持三态的形式。所谓三态就是带CheckBox的TreeView每个Node都有三种状态,即选中,未选中和部分选中(指该Node的字节点并非全部选中)。  阅读全文

posted @ 2008-09-26 11:46 eaglet 阅读(2016) | 评论 (7)编辑

2008年9月5日

     摘要: .net 框架号称永远不会发生内存泄漏,原因是其引入了内存回收的机制。但实际应用中,往往我们分配了对象但没有释放指向该对象的引用,导致对象永远无法释放。最常见的情况就是给对象添加了事件处理函数,但当不再使用该对象时却没有将该函数从对象的事件handler中减掉。另外如果分配了非托管内存,而没有手工释放,GC同样无能为力。所以当.net应用发生内存泄漏后如何跟踪应用的内存使用情况,定位到程序设计中的缺陷显得非常重要。本文将介绍通过.NET Memory Profiler来跟踪.net应用的内存泄漏,为定位.net应用内存问题提供一个解决途径。  阅读全文

posted @ 2008-09-05 15:15 eaglet 阅读(1966) | 评论 (12)编辑

2008年8月15日

     摘要: 今天在博问中看到一个动物叫三声的设计模式讨论,觉得很有意思,抽空实现了一下,觉得有必要写下来,和大家一起探讨探讨。  阅读全文

posted @ 2008-08-15 09:41 eaglet 阅读(2152) | 评论 (14)编辑

2008年7月9日

     摘要: 最近我的博客中有两位网友在使用 KTDictSeg 1.3 + lucene.net 2.0 + HighLight.net 2.0 是出现问题,高度怀疑是HighLight.net 2.0 版本的Bug,
今天腾出时间把几个组件的源码全部下下来,调试了一把,终于找到了这个Bug,下面把Bug的具体原因和修改后的源码发上来,供大家参考。另外哪位网友
知道如何向 lucene apache 组织 申报Bug,麻烦告知一声,以便我将这个Bug提交给该组织,让它的后续版本可以改进这个错误。  阅读全文

posted @ 2008-07-09 09:22 eaglet 阅读(1486) | 评论 (9)编辑

2008年7月7日

     摘要: HighLight.net 是Lucene.net 带的一个开源高亮显示的组件,这个组件 2.0 版本以上的源码在网上很难找到,而这个组件
感觉又存在一些bug,遇到问题想调试一下,又没有源码,实在让人抓狂。
今天用最土的方法,一个一个文件下载,总是把这个版本的源码给凑齐了,编译了一下,没有问题,发上来,方便大家调试,
大家如果发现这里面有什么bug,还望多多分享。  阅读全文

posted @ 2008-07-07 11:10 eaglet 阅读(1680) | 评论 (17)编辑

2008年7月3日

     摘要: 目前互联网上关于Lucene 及 Lucene.net 的文章很多,看了一些,感觉绝大部分还是偏向于应用,真正深入探讨其核心算法的文章不是太多,最近打算深入研究一下Lucene.net,把一些关键技术点的核心算法搞清楚。在开始做这个工作之前,先对目前互联网上可以利用的资源做个汇总,算是抛砖引玉吧,还望网友们多来补充,大家共同学习!
  阅读全文

posted @ 2008-07-03 21:29 eaglet 阅读(2055) | 评论 (13)编辑

2008年6月13日

     摘要: 今天对 .net 2.0 的 System.Runtime.Remoting.Channels.Ipc 做了一个相同的测试,测试结果是每秒传输速度为 33MB。 由于底层技术都是一样的,我估计其比我这个例子(180MB每秒)慢的主要原因应该是在序列化上。另外今天对我这个例子进行了一些补充,增加了对流方式的支持,并做了一个通过流方式传输文件的例子。


  阅读全文

posted @ 2008-06-13 13:43 eaglet 阅读(1785) | 评论 (9)编辑