摘要: 我开发的中文分词程序,开源发布,其实哪个中文分词的整体架构是比较糟糕的。架构是否优秀决定了很多构思无法实现,思考了比较久,最近准备开发第二版,抛弃以前的架构,重新实现。下面是一些设计和构思。计划是两周时间开发完成beta版(如果因为工作关系,也有可能放弃),主要是希望和大家交流下设计思想,我觉得构思很重要,想得实现不了,可以慢慢研究,想不到才是头大的问题,希望能和大家一起交流下:新版中文分词构想(...阅读全文
posted @ 2007-03-19 09:47 kwklover 阅读(8543) 评论(19) 编辑
摘要: 功能介绍:请参看花2周时间开发的中文分词终于有点小样了(有些功能没体现出来)本中文分词是基于匹配模式开发的中文分词程序,为本人练手作品。也可以直接使用。但不建议。因为整体架构有一些基础性问题。不过做为开发中文分词的参考,相信还是有一定价值的。最近吕震宇老师发布了ICTCLAS的C#版SharpICTCLAS。很优秀的中文分词程序。我的这个和它根本不是一个级别的。不过在自己的应用中,估计还是不能直接...阅读全文
posted @ 2007-03-19 06:14 kwklover 阅读(16518) 评论(29) 编辑
摘要: deleted阅读全文
posted @ 2007-03-19 04:27 kwklover 阅读(439) 评论(2)  编辑