King_K

导航

2014年6月17日 #

转:中文分词算法笔记

摘要: 中文分词基本算法主要分类基于词典的方法、基于统计的方法、基于规则的方法、(传说中还有基于理解的-神经网络-专家系统,按下不表)1、基于词典的方法(字符串匹配,机械分词方法)定义:按照一定策略将待分析的汉字串与一个“大机器词典”中的词条进行匹配,若在词典中找到某个字符串,则匹配成功。按照扫描方向的不同... 阅读全文

posted @ 2014-06-17 21:12 King_K 阅读(201) 评论(0) 推荐(0) 编辑