title: 【概率论】4-5:均值和中值(The Mean and the Median)
categories:
- Mathematic
- Probability
keywords:
- Mean
- Median
- Mean Squared Error
- Mean Absolute Error
toc: true
date: 2018-03-25 21:01:04


Abstract: 本文介绍均值和中值的对比,以及最小平方误差,最小绝对误差
Keywords: Mean,Median,Mean Squared Error,Mean Absolute Error

开篇废话

昨天犯了个大错误,google分析配置出错了,所以这两天博客访问一直显示零,所以昨天都很沮丧,生活有时候就这样,一些错误,后果非常让人非常沮丧,我们在面对这些沮丧的结果时的态度能决定我们的所有。
均值是度量分布中心位置的一种方法,中值也是,这就是我们上一篇说到的,关于一个属性的定义,我们现在定义分布的中心位置,就有了两种方法,这两种都能定义中心的合理方法,各有各的优点,也有自己的缺点,所以我们今天就来对比下这两种中心位置的数字特点。

The Median

4.1中介绍过一个分布的的期望,是在随机变量所在的数轴的重心位置,这种角度下,期望是一个中心位置。
另一种就是假设存在某个随机变量 m0m_0 小于 m0m_0 对应的概率是 1/21/2 大于 m0m_0 的对应概率为 1/21/2 这从某种意义上说也是一个中心位置。
两个不一样的定义方式,就有两种不同的方法用于不同的问题
最简单的例子就是图像处理里面两种不同的滤波,均值滤波和中值滤波,对应处理的噪声也完全不同。
均值,也就是期望我们已经研究了4篇了,今天我们主要研究一下中值,虽然在c.d.f中有介绍,但是我们还是重新说说。
值得一提的是与均值不同,分布的均值可以有一个或者没有,而中值可以有一个,还可以有很多个,这个我们后面会说到。

Definition Median.Let XX be a random varibale.Every number mm with the following prperty is called a median of the distribution of XX:
KaTeX parse error: Expected & or \\ or \cr or \end at position 37: …\leq m)\geq 1/2\̲ ̲\end{aligned} \…

中值的定义如上,还有一种跟奇特的说法和上面是等价的。

Firest,if m is included with the values of X to the left of m,then
Pr(Xm)Pr(X>m) Pr(X\leq m)\geq Pr(X>m)

seconde ,if m is included with the values of X to the right of m,then
Pr(Xm)Pr(X<m) Pr(X\geq m)\geq Pr(X<m)

If there is a number mm such that Pr(X<m)=Pr(X>m)Pr(X < m)=Pr(X > m) ,that is,if the number mm does actually divide the total Probability into two equal parts,then mm will of course be a median of the distribution of XX

两种定义中值的方法得到一样的结果。值得注意的就是一点,中值可能不止一个,当中值不止一个的时候我们这里选用最小的作为中值,当然,也可以选中间的,或者最大的,这取决于你自己的需求。

文章写到这里,书上开始写🌰,目测有一斤🌰 。例子的核心就是中值不一定只有一个。

Comparison of the Mean and the median

最重要的一个区别就是期望有些分布是没有的,但是中值绝对存在,而且有很多时候还不止一个。所以对于某些应用中值的稳定性更好,最简单的例子就是我们伟大祖国各个城市的平均收入贼高,但是你和周围的小伙伴总发现自己拖后腿,那么这时候平均值可能真的不能反映实际的情况,需要用中值,如果你的工资连中值都没到,说明你确实不行,你说你比不过马云马化腾我们理解,你连你隔壁都不如,那就是你的问题了。
下面定义一个双射函数,这个证明我不写了,书上有,但是我觉得不完美,因为我马上要在数学分析那个系列里面讲这个情况,所以这里只给出定理,着急的小伙伴就自己查查资料,不着急的,等我数学分析。

Theorem One-to-One Function.Let XX be a random variable that takes values in an interval II of real numbers.Let rr be a one-to-one function defined on the interval II.If mm is a median of XX ,then r(m)r(m) is a median of r(X)r(X)

其实用到的主要特性是双射函数的可逆性质,换句话说就是能找到反函数。

接下来我们开始进入到很贴近应用的部分了。

以上为节选,完整原文地址:https://www.face2ai.com/Math-Probability-4-5-The-Mean-and-the-Median转载请标明出处

 posted on 2018-09-22 17:14  TonyShengTan  阅读(1965)  评论(0)    收藏  举报