摘要:
日志内同 阅读全文
posted @ 2012-11-09 18:05
icesaber
阅读(100)
评论(0)
推荐(0)
摘要:
本文介绍了基于词库的双向最大匹配算法。该算法实现简单,分词效果依赖于词库。在词库相当的情况下,分词效果不错。某些情况下甚至强于基于隐马尔科夫模型的智能分词。【双向最大匹配算法】从名字上来看(顾名思义),就是以最大匹配为原则、以双向的切分为方法进行汉子切分。本文所举得所有例子均是在词库足够完整的情况下进行的。什么叫以最大匹配为原则?最大匹配原则就是在词库中找到最长匹配字符串作为一个单词。如“我出生在中华人民共和国”,以最大匹配原则进行分词则分词结果为“我”、“出生”、“在”、“中华人民共和国”,而不是“我”、“出生”、“在”、“中华”、“人民”、“共和国”。什么是双向切分?要说双向切分算法就不得 阅读全文
posted @ 2012-11-09 17:53
icesaber
阅读(3640)
评论(0)
推荐(0)

浙公网安备 33010602011771号