朴素贝叶斯

Loading [MathJax]/jax/output/HTML-CSS/fonts/STIX/fontdata.js
+ 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。

朴素贝叶斯方法的学习与分类

名词公式：
输入空间：\(X\subseteq R^n\)
输出空间：\(Y = {c_1, c_2, ..., c_K}\)
训练数据集合：\(T={(x_1, y_1), (x_2, y_2), ..., (x_N, y_N)}\)
先验概率分布：\(P(Y=c_k), k=1,2,...,K\)
条件概率分布：\(P(X=x|Y=c_k) = P(X^1=x^1, X^2=x^2, ..., X^n=x^n|Y=c_k)\)
后验概率（贝叶斯定理）：\(P(Y=c_k|X=x) = \frac{P(X=x|Y=c_k)P(Y=c_k)} {\sum_k P(X=x|Y=c_k)P(Y=c_k)}\)

\[P(Y=c_k|X=x) = \frac{P(Y=c_k) \prod_j P(X^j=x^j|Y=c_k) } {\sum_k P(Y=c_k) \prod_j P(X^j=x^j|Y=c_k)} \]

\[y=f(x) =\underset{c_k}{argmax} \frac{P(Y=c_k) \prod_j P(X^j=x^j|Y=c_k) } {\sum_k P(Y=c_k) \prod_j P(X^j=x^j|Y=c_k)} \]

\[y=f(x) =\underset{c_k}{argmax} P(Y=c_k) \prod_j P(X^j=x^j|Y=c_k) \]

\[P(Y=c_k) = \frac{\sum_{i=1}^{N} I(y_i=c_k) } {N}, k=1, 2, ..., K \]

\[P(X^j=a_{jl}|Y=c_k) = \frac{I(x^j_i=a_{jl}, y_i=c_k)} {\sum_{i=1}^N I(y_i=c_k)}, j=1, 2, ..., n; l=1, 2, ..., S_j; k=1, 2, ..., K \]

\[P(Y=c_k) \prod_{j=1}^{n} P(X^j=x^j|Y=c_k) \]

\[y=\underset{c_k} {arg max} P(Y=c_k) \prod_{j=1}^{n} P(X^j=x^j|Y=c_k) \]

\[P_{\lambda}(X^j=x_{jl}|Y=c_k) = \frac {\sum_{i=1}^N I(x^j_i = a_{jl}, y=c_k) + \lambda} {\sum_{i=1}^N I(y_i=c_k) + S_j \lambda}, \lambda \geq 0 \]

等价于在各个取值的频数上赋予一个正数\(\lambda\)。

\(\lambda=0\)为极大似然估计；\(\lambda=1\)时，称为拉普拉斯平滑

posted @ 2016-08-12 14:58 英吹斯汀ING 阅读(325) 评论(0) 收藏举报

刷新页面返回顶部