游荡的灵魂
无根的灵魂,除了游荡,还能去那里?
posts - 14,  comments - 60,  trackbacks - 8
posted @ 2008-03-05 14:35 游荡的灵魂 阅读(139) | 评论 (0)编辑
     摘要: 分词模块中主要是2大部分,首先是分词算法部分,然后就是词库部分。分词算法我们使用的是逆向最大匹配算法、语法效验、生词识别(基于上下文统计和语法效验)。这篇随笔主要说一下词库部分。
分词效率很大程度取决词库的设计,词库设计必须实现最大限度的查找匹配词。词库设计主要是2大部分,词数据部分和索引部分。  阅读全文
posted @ 2006-12-30 17:23 游荡的灵魂 阅读(2245) | 评论 (8)编辑

<2008年12月>
30123456
78910111213
14151617181920
21222324252627
28293031123
45678910

与我联系

搜索

 

常用链接

留言簿

我参与的团队

随笔分类

随笔档案

OPENGIS

最新评论

阅读排行榜

评论排行榜