公告

EM算法笔记

EM算法在很多地方都用使用到，比如简单的K-means算法，还有在隐马尔可夫里面，也涉及到了EM算法，可见EM算法在机器学习领域的重要地位。在这里就写一下我对于EM算法的一些理解笔记。后续有新的理解也会追加的。
EM算法的全称叫做：期望最大。EM算法的想法很简单，就像一个人有两条腿向前走，你总是需要固定一条腿动另一条腿这样交替往前走。这里面的两条腿，一个是隐变量，一个是参数 $θ$

凹凸函数

这个是《最优化》里面的概念，如果它的二阶导大于0，那么就是凸函数；如果是二阶导小于0，那么就是凹函数。（我记得《最优化》数学老师说，高数的定义和最优化的定义是反着的，因为用的概念不一样，高数好像用的是前苏联的定义，最优化是用的欧洲定义。我也不知道是不是真的……）。这样可能不是很容易记住，所以就取两个很有代表性的函数，方便记忆：凸函数： $x^{2}$

Jensen不等式

这个是EM里面，我认为最重要的一个概念，因为它其实是贯穿整个EM的算法里面的。Jensen不等式的概念也很简单，就是如果是凸函数：f(E(x)) < E(f(x));凹函数：f(E(x)) > E(f(x))。这个定义可能一开始没看明白是什么意思，主要问题可能是那个E(x)的期望。换一个简单的说法, 就是如果是凸函数 $f (\frac{x + y}{2}) < \frac{f (x) + f (y)}{2}$