Fork me on GitHub

随笔分类 -  NLP

摘要:以下几篇文章自己需要好好反复研读几遍: 1.从决策树学习谈到贝叶斯分类算法、EM、HMM http://blog.csdn.net/v_july_v/article/details/7577684 2.数学之美番外篇:平凡而又神奇的贝叶斯方法 http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/ 3.HMM学习最佳范例 http://www.52nlp.cn/hmm-learn-best-practices-one-introduction 阅读全文
posted @ 2013-01-13 20:25 落崖惊风 阅读(2003) 评论(0) 推荐(0)
摘要:分词方法 目前的分词方法归纳起来有3 类: 第一类是基于语法和规则的分词法。其基本思想就是在分词的同时进行句法、语义分析, 利用句法信息和语义信息来进行词性标注, 以解决分词歧义现象。因为现有的语法知识、句法规则十分笼统、复杂, 基于语法和规则的分词法所能达到的精确度远远还不能令人满意, 目前这种分词系统还处在试验阶段。 第二类是机械式分词法(即基于词典)。机械分词的原理是将文档中的字符串与词典中的词条进行逐一匹配, 如果词典中找到某个字符串, 则匹配成功, 可以切分, 否则不予切分。基于词典的机械分词法, 实现简单, 实用性强, 但机械分词法的最大的缺点就是词典的完备性不能得到保证。据... 阅读全文
posted @ 2013-01-10 11:24 落崖惊风 阅读(13469) 评论(3) 推荐(1)