free-lancer

我的刀快,是因为我简单。天边有一对双星,那是我梦中的眼睛。

导航

中文分词算法---快捷的分词算法

Posted on 2006-03-20 17:01  hjl  阅读(1540)  评论(3)    收藏  举报

实现平台:
    Windows server 2003
    开发环境  Visual Studio 2005   C#
分词方法:
 基本思路是我前几天看到的一篇文章中那位大哥提出的,我看完后感觉这种解决方案比较好,不需要复杂的语法分析、句法分析等,就是通过树型数据结构把中文词库组织起来,这样分词过程就是树遍历的过程,思路非常清晰,适合于小的项目的应用。原文的Site:http://xiecc.itpub.net/post/1476/52479 
具体实现:
第一,创建树型结构,                ''~``
                        ( o o )
+------------------.oooO--(_)--Oooo.---------------------+
| John Smith                                             |
|                       E-mail: fake-company@server.com  |
| Fake Company          http://www.fake-company.com/     |
| Ottawa, Canada     (   )                               |
+---------------------\ (----(   )---------------

Your satisfaction is necessary to our success. Our goal is to provide you with the best level of customer service, and we welcome your comments and suggestions

Email:

Sales: sales@CuteSoft.Net  

General: info@CuteSoft.Net

Support: support@CuteSoft.Net

Address:


CuteSoft
35 SHERWOOD CRES
BELLEVILLE, ON
K8P 5G2
Canada

--------+
                       \_)    ) /
                             (_/