08 2016 档案

摘要:这篇文章记录一下解决HMM三大问题的第二个问题的学习过程。回忆一下,第二个问题是什么来着?给定HMM模型\(lambda\)和观测序列O,求产生这个观测序列概率最大的状态序列是什么?把这个问题叫做解码问题,也是挺贴切的~ 求解这个问题,有一个经典的算法,叫做Viterbi算法。Viterbi是个了不 阅读全文
posted @ 2016-08-28 14:59 HOLD 阅读(2589) 评论(0) 推荐(0)
摘要:学习HMM的一些简单总结,具体的内容和推导可以去参考《条件随机场理论综述》,写的非常好。 1,离散马尔科夫过程 时间和状态都是离散变量,且当前所处的状态只与它之前的一个状态有关(马尔科夫性),这种随机过程即为马尔科夫过程。 2,HMM的五个要素 HMM可以用一个五元组表示:\(\lambda= (S 阅读全文
posted @ 2016-08-27 15:51 HOLD 阅读(3140) 评论(0) 推荐(0)
摘要:文本分类有很多种方法,朴素贝叶斯应该算是里面最容易的一种了吧。这篇文章简单介绍朴素贝叶斯的原理,然后是spark上的实现方法。 1,问题描述 现实中可能会一些问题,比如一个邮件是不是垃圾邮件?一个新闻是属于社会类还是科技类还是娱乐类?这些问题都可以抽象成:给定一些已经分类好的样本集合{(di,yi) 阅读全文
posted @ 2016-08-12 10:22 HOLD 阅读(639) 评论(0) 推荐(0)