First we try, then we trust

  博客园 :: 首页 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
  183 随笔 :: 111 文章 :: 2960 评论 :: 298 Trackbacks

2007年2月6日 #

     摘要: SharpICTCLAS 1.0 发布了,修正了测试版的几处错误。  阅读全文
posted @ 2007-04-18 15:52 吕震宇 阅读(7964) | 评论 (66)编辑

     摘要: SharpICTCLAS(测试版)发布了!  阅读全文
posted @ 2007-03-15 12:52 吕震宇 阅读(14609) | 评论 (39)编辑

具体内容请访问我的文章:

SharpICTCLAS分词系统简介(7)OptimumSegment

SharpICTCLAS分词系统简介(8)其它

===全文完===

非常高兴在这最后一篇文章写完之时得到了张华平老师的授权。我会尽可能快的将SharpICTCLAS源文件放上来供大家测试使用的。

posted @ 2007-03-14 23:19 吕震宇 阅读(3698) | 评论 (6)编辑

具体内容请访问我的文章

SharpICTCLAS分词系统简介(6)Segment

posted @ 2007-03-13 22:38 吕震宇 阅读(3140) | 评论 (1)编辑

具体内容请访问我的文章

SharpICTCLAS分词系统简介(5)NShortPath-2

posted @ 2007-03-12 22:44 吕震宇 阅读(3562) | 评论 (3)编辑

具体内容请访问我的文章

SharpICTCLAS分词系统简介(4)NShortPath-1

posted @ 2007-03-09 22:51 吕震宇 阅读(3643) | 评论 (1)编辑

具体内容请访问我的文章

SharpICTCLAS分词系统简介(3)DynamicArray

posted @ 2007-03-09 09:02 吕震宇 阅读(3652) | 评论 (0)编辑

具体内容请访问我的文章

SharpICTCLAS分词系统简介(1)读取词典库

SharpICTCLAS分词系统简介(2)初步分词

posted @ 2007-03-08 14:36 吕震宇 阅读(3975) | 评论 (2)编辑

在研究了一段时间中科院计算所张华平、刘群所开发的ICTCLAS分词系统(Free版)代码后,阅读了大量的相关资料,我开始着手将C++的ICTCLAS分词系统移植到.net平台下,并取得了较好的实验结果。这种移植并不容易,在研究了ICTCLAS分词理论的同时还要阅读C++代码实现,其中遇到了很多困惑、迷茫,也不得不重写了一小部分代码,我将在随后的文章中介绍具体实现。

目前除了最后的词性标注部分还没有完全完工外,其它部分已经接近尾声(包括初始切分、N最短路径、人名、地名的识别以及最终优化等)。

部分分词结果以及移植思路请访问我的文章:《实现ICTCLAS到C#平台的移植

posted @ 2007-03-07 22:45 吕震宇 阅读(3923) | 评论 (9)编辑

上篇文章《天书般的ICTCLAS分词系统代码(一)》 说了说ICTCLAS分词系统有些代码让人无所适从,需要好一番努力才能弄明白究竟是怎么回事。尽管有很多人支持应当写简单、清晰的代码,但也有人持不同意见。主要集中在(1)如果效率高,代码复杂点也行; (2)只要注释写得好就行;(3)软件关键在思路(这我同意),就好像买了一台电脑,不管包装箱内的电脑本身怎么,一群人偏在死扣那个外面透明胶带帖歪了(这我坚决不同意,因为只有好思路出不来好电脑,好电脑还要性能稳定,即插即用的好硬件;另外天书般的代码不仅仅是透明胶带 贴歪的问题,他甚至可能意味着电脑中的绝缘胶带失效了...)。

这两天在抓紧学习ICTCLAS分词系统的思路的同时,也在消化学习它的代码实现,然而我看到的代码已经不仅仅是为了效率牺牲代码清晰度的问题了,我看到的是连作者都不知道自己真正想要做什么了......

更多内容请参考我的文章《天书般的ICTCLAS分词系统代码(二)

posted @ 2007-02-26 13:34 吕震宇 阅读(3010) | 评论 (4)编辑

ICTCLAS分词系统是由中科院计算所的张华平、刘群所开发的一套获得广泛好评的分词系统,该版的Free版开放了源代码,为初学者提供了宝贵的学习材料。

然而在我阅读代码的过程中,越来越对ICTCLAS天书般的代码感到厌烦。我不得不佩服中科院计算所的人思维缜密,头脑清晰,能写出滴水不漏而又让那些“头脑简单”的人百思不得其解的代码。将一件本来很简单的事情做得无比复杂...

更多内容请参考我的文章《天书般的ICTCLAS分词系统代码(一)

posted @ 2007-02-21 00:29 吕震宇 阅读(3776) | 评论 (10)编辑

     摘要: 为了今后随笔中所带的代码更具特色一些,特给代码格式来个“Copy Code”功能,允许直接将代码内容拷贝到剪贴板上。大家可以试一试。目前至少支持IE和FireFox两种浏览器的访问。  阅读全文
posted @ 2007-02-08 10:09 吕震宇 阅读(4732) | 评论 (14)编辑

最近阅读了黄忠成的Object Builder系列文章感到受益匪浅,所以将该系列文章整理了一番(将繁体转换为简体,另外对于一些习惯用法进行了调整,对文章及代码格式重新进行了调整,修订了文中几处小错误),现放上来供大家参考。

[转][黄忠成]Object Builder Application Block (1)
[转][黄忠成]Object Builder Application Block (2)
[转][黄忠成]Object Builder Application Block (3)
[转][黄忠成]Object Builder Application Block (4)

~~~~~~~~~~~~~~~~~~~~~~~~~~~

另外受这一系列文章的启迪,目前正在构思几篇新文章,初步题目定为《创建对象的方法及其应用》。目前文章用到的代码调试已经完成了大半,如果有时间我会开始着手文章写作工作。基本内容分以下几部分:

  • 1、CreateOjbWithNew

使用new命令完成对象的创建。(既然是一个系列,缺少此部分就不完整了)

  • 2、CentralizeObjCreation2Factory

针对接口编程(使主程序依赖于公共接口与工厂)

集中对象的创建(出现问题好找)

问题(仍然摆脱不了工厂对其它对象的依赖,仅仅实现了创建对象的集中管理而已)

  • 3、IndependentFactoryModel

使用Assemby以及CreateInstance方法创建对象,实现了工厂与产品间解耦。

  • 4、AddinSample

案例分析,使用上面模型实现一个插件结构的应用程序。该程序运行机制仿照SharpDevelop(当然是大大简化了)的AddinTree结构,只要在Addins目录下存放的文件会被自动的Pickup并容入主界面。

  • 5、BeforeDependencyInjection

为了后面的案例做准备工作。在没有Dependency Injection框架时,自己手工创建对象。

  • 6、DependencyInjectionWithConfig

自己实现的一个“依赖注入”框架(非常简单,纯粹演示目的),使用配置文件指导对象创建工作。

  • 7、DependencyInjection与Ioc

通过上面两个例子我们了解了什么是依赖注入,可为什么依赖注入为什么最开始叫做控制反转呢?本段内容揭示其中的联系以及“容器”这个概念的特殊含义。

  • 8、ObjectBuilder

可以将ObjectBuilder理解成一个智能加工工场,根据用户的不同订单策略在流水线上加工各种对象。该部分内容对ObjectBuilder做一个宏观的介绍。先将文中一张图放上来:

  • 9、TranslatorSampleUsingOB

对OB的一个实际应用案例。模拟TechEd英文会场,参会人员可根据需要选择不同的翻译服务,充分享受"容器"以及"依赖注入"的强大功能,系统借助ObjectBuilder实现。

 

posted @ 2007-02-06 11:25 吕震宇 阅读(4648) | 评论 (18)编辑