你应该掌握的四种參数预计技术

所谓预计

概率学上，对未知的概率密度函数进行预计有两种方法：參数预计和非參数预计。非參数预计是不假定数学模型。直接利用已知类别的学习样本先验知识预计数学模型。经常使用的方法由直方图方法、神经网络方法、Parzen窗法和Kn近邻法。

而參数预计则是先假定研究问题具有某种数学模型，如正态分布、二项分布等。再利用已知类别的学习样本，预计模型里的參数。经常使用的方法有距预计、最大似然预计、最大后验预计和贝叶斯预计。

本文主要介绍四种经常使用的參数预计技术。

參数预计

1. 距预计
用样本矩作为相应整体矩的预计量，而以样本矩的连续函数作为相应的整体矩的连续函数的预计量。用数学公式描写叙述矩预计的过程为：

⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ μ 1 = μ 1 (θ 1, θ 2, . . ., θ k) μ 2 = μ 2 (θ 1, θ 2, . . ., θ k) . . . . . . μ k = μ k (θ 1, θ 2, . . ., θ k) ⎫ ⎭ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪

从中解出參数

⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ θ 1 = θ 1 (μ 1, μ 2, . . ., μ k) θ 2 = θ 2 (μ 1, μ 2, . . ., μ k) . . . . . . θ k = θ k (μ 1, μ 2, . . ., μ k) ⎫ ⎭ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪

当中。

θ1,θ2,...,θk是k个待估參数，

μ1,μ2,...,μk是整体k阶矩。先用已知样本，计算k阶样本矩，公式为：

A l = \sum N i = 1 X l i N

然后用计算得到的k阶样本矩来作为对整体矩的预计，带入方程得到相应的矩预计：

θ ¯ l = θ i (A 1, A 2, . . ., A k)

2. 最大似然预计（MLE）
样本X1,X2,...,Xn来自整体X，整体的概率密度为P{X=x}=p(x;θ)或f(x;θ)。

当中θ∈Θ的形式已知。θ为待估參数。得到其似然函数为：

L (θ) = L (x 1, x 2, . . ., x n; θ) = \prod i = 1 n f (x i; θ)

那么，当

L(x1,x2,...,xn;θ)在

θ∈Θ中取得最大值时，即公式描写叙述为：

L (x 1, x 2, . . ., x n; θ ¯) = m a x θ \in Θ L (x 1, x 2, . . ., x n; θ)

θ¯就是

θ的最大似然预计

θ¯(x1,x2,...,xn)。在应用中经常採用对数形式给出对数似然方程。在计算中，令

dL(θ)dθ=0或者

dlogL(θ)dθ=0，得到最大值处的

θ就是最大似然预计。

3. 最大后验预计（MAP）
最大似然预计没有考虑θ的概率分布，或者觉得θ的概率分布在θ∈Θ上式均匀分布的。在贝叶斯学派看来。θ也是随机变量。有着一定的先验概率。因此假设不加以考虑，预计结果会出现较大的误差。

最大后验预计的表达式为：

p (θ | x 1, x 2, . . ., x n) = p ( x 1 , x 2 , . . . , x n | θ ) \times p ( θ ) \sum i { p ( x 1 , x 2 , . . . , x n | θ i ) \times p ( θ i ) } = L ( x 1 , x 2 , . . . , x n | θ ) \times p ( θ ) c o n s t

公式能够等效为：

后 验 概 率 = ( 似 然 度 \times 先 验 概 率 ) 标 准 化 常 量 = 标 准 似 然 度 \times 先 验 概 率

4. 贝叶斯预计
贝叶斯预计也是基于后验概率公式。但引入了损失函数作为推断的标准。贝叶斯预计得一般步骤为

选择先验概率分布。设为π(θ)
确定似然函数。
确定參数θ的后验分布。
选择损失函数。
引入一个非负函数。记为loss(θ^,θ)来刻画參数真实值θ与预计值θ^的差距严重程度，称为损失函数。经常使用的损失函数有：平方误差损失函数
预计參数。
依据选择的损失函数的期望误差最小值相应的解θ^作为參数的贝叶斯预计值。以平方误差损失函数为例。贝叶斯预计给定X时的条件期望为：
$θ^= E [θ | X] = \int θ p (θ | X) d θ$

2015-8-22
艺少

posted on 2017-06-22 14:19 cynchanpin 阅读(268) 评论(0) 收藏举报

刷新页面返回顶部