实现平台:
Windows server 2003
开发环境 Visual Studio 2005 C#
分词方法:
基本思路是我前几天看到的一篇文章中那位大哥提出的,我看完后感觉这种解决方案比较好,不需要复杂的语法分析、句法分析等,就是通过树型数据结构把中文词库组织起来,这样分词过程就是树遍历的过程,思路非常清晰,适合于小的项目的应用。原文的Site:http://xiecc.itpub.net/post/1476/52479
具体实现:
第一,创建树型结构, ''~``
( o o )
+------------------.oooO--(_)--Oooo.---------------------+
| John Smith |
| E-mail: fake-company@server.com |
| Fake Company http://www.fake-company.com/ |
| Ottawa, Canada ( ) |
+---------------------\ (----( )---------------
Email:
Sales: sales@CuteSoft.Net
General: info@CuteSoft.Net
Support: support@CuteSoft.Net
Address:
CuteSoft
35 SHERWOOD CRES
BELLEVILLE, ON
K8P 5G2
Canada
--------+
\_) ) /
(_/
浙公网安备 33010602011771号