2008年11月1日

中文分词的功能流程

摘要: 中文分词方法变传统的"分词"过程为"(堆)砌词"的过程,首先将输入的中文文档打散为一系列的短句,将短句打散为原子系列,然后将原子系列"(堆)砌"成词,本文给出中文砌词的一般流程。 阅读全文

posted @ 2008-11-01 23:40 刀剑笑 阅读(1104) 评论(0) 推荐(0)

中文分词语言模型的表示方法探讨

摘要: =============================================================================== 如有需要可以转载,但转载请注明出处,并保留这一块信息,谢谢合作! 部分内容参考互联网,如有异议,请跟我联系! 作者:刀剑笑(Blog:http://blog.csdn.net/jyz3051) Email:jyz3051 at yahoo ... 阅读全文

posted @ 2008-11-01 23:37 刀剑笑 阅读(297) 评论(0) 推荐(0)

用动态规划建立中文分词的语言模型

摘要: =============================================================================== 如有需要可以转载,但转载请注明出处,并保留这一块信息,谢谢合作! 部分内容参考互联网,如有异议,请跟我联系! 作者:刀剑笑(Blog:http://blog.csdn.net/jyz3051) Email:jyz3051 at yahoo ... 阅读全文

posted @ 2008-11-01 22:48 刀剑笑 阅读(660) 评论(0) 推荐(0)

中文分词的语言模型

摘要: =============================================================================== 如有需要可以转载,但转载请注明出处,并保留这一块信息,谢谢合作! 部分内容参考互联网,如有异议,请跟我联系! 作者:刀剑笑(Blog:http://blog.csdn.net/jyz3051) Email:jyz3051 at yahoo ... 阅读全文

posted @ 2008-11-01 20:29 刀剑笑 阅读(647) 评论(0) 推荐(0)

三种中文分词算法优劣比较

摘要: 到目前为止,中文分词包括三种方法:1)基于字符串匹配的分词;2)基于理解的分词;3)基于统计的分词。到目前为止,还无法证明哪一种方法更准确,每种方法都有自己的利弊,有强项也有致命弱点,本文从多个方面分析这三种分词算法的优劣。 阅读全文

posted @ 2008-11-01 17:18 刀剑笑 阅读(986) 评论(0) 推荐(0)

导航