概率笔记6——多维随机变量

　　和其它问题一样，概率也可能同时受到多个条件的影响，例如考察某地区中学生的身体素质，随机地选取一名学生，观察学生的身高 X，体重 Y 和肺活量 Z 等指标。随机变量 X，Y，Z 来自同一样本空间，它们的取值可能相互影响。像这样同时考虑的多个随机变量，称为多维随机变量。本章以二维随机变量为例，介绍多维随机变量的相关概念。

联合分布

　　和一维变量的概率分布类似，联合分布把舞台扩展到了多维，这里的“联合”就是多个随机变量的意思。

　　假设一个事件受到两个变量x和y的影响，它的联合分布定义为：

　　其中X表示具体的取值，x表示变量。

　　上一章提到过，分布是指概率的累加，是把事件映射为数字，一个二维联合分布的变量取值范围是整个二维平面，但F(x,y)的取值范围是0~1。

离散型

联合概率

　　联合概率指的是包含多个条件且所有条件同时成立的概率，也叫联合分布率。

　　用x_i和y_j的两个随机变量所有可能的取值，P(X=x_i, Y=y_j)表示在X=x_i和Y=y_j下事件发生的概率。设P(X=x_i, Y=y_j)=p_ij，则下表是二维离散型随机变量(X, Y)的联合概率：

　　联合分布率实际上是一个矩阵。既然是概率，联合概率也满足下面两个条件：

联合分布

　　一维随机变量的分布函数：

　　二维随机变量的分布函数：

　　其中：

　　分布函数和分布略有区别，“分布”是指累加概率，“分布函数”是将累加概率函数化。F(x,y)=P{X≤x,Y≤y}是分布函数，它的值是所有在X≤x,Y≤y下的概率分布。

边缘分布

　　先看表1的第一行，它固定了x=x₁，此时在表格右侧加入一列：

　　p₁_·表示x的取值固定，y取任意值时的概率分布，即：

　　由于p₁_·是写在表格的边缘，所以称为x=x₁的边缘分布。对于任意行来说：

　　这实际上是在表示X= x_i时事件发生的概率。类似的，y=y_j的边缘分布是：

条件概率

　　条件概率是指在A事件发生的条件下，事件B发生的概率，表示为P(B|A)，它有一个重要公式：

　　多维随机变量的条件概率公式与此类似，在Y=y_j 条件下X=x_i的概率：

独立性

　　对于二维离散型随机变量(X, Y)来说，如果满足：

　　那么这两个随机变量之间是没有相互影响的，称X和Y之间互相独立。反过来也一样，如果满足了独立性，那么必然有上式的关系。

连续型

　　由于是连续型变量，所以无法像离散型变量那样简单地计算在某一点的概率（概率可以表示为几何度量，点的度量是0，因此算某一点的概率也是0，或者说计算点的概率没有意义），只能计算某一取值范围内的概率，也就是概率分布（概率的累加）。

联合概率密度函数和联合分布

　　某个地区的人口密度越大，这个地区的人口越多。同样的，概率密度越大，说明这个区域的发生某件事的概率越大。

　　设F(x,y)是二维连续型随机变量(X,Y)的联合分布函数，如果存在一个非负函数f(x,y)，对于任意实数x,y，有：

　　则称f(x,y)是二维连续型随机变量(X,Y)的联合概率密度函数。

　　u和v在计算后定积分后会被x和y代替。可以对比上一章中一维随机变量的分布函数来理解F(x,y)。概率分布是概率的累加，而累加正好是积分的定义。在几何上，F(x,y)表示了曲面柱体的体积：

　　假设在R区域上，x₁<x<x₂, y₁<y<y₂，那么该区域上的概率分布是：

　　dydx是R上的面积积元，它是面积无限接近0的小矩形，但不是0。至此，概率和多重积分联系到一起。上式中没有u和v，这是由于已经确定了x和y的取值范围，且f本来就是关于x和y的函数，因此没必要再引入u和v。如果非要使用u和v，那么上式等价于：

　　由于F是分布函数，因此在整个定义域上满足：

边缘分布和边缘密度函数

　　联合分布表达的是二维随机变量(X, Y)的整体分布，同时X和Y也有各自的边缘分布。与离散型类似，连续型随机变量的边缘分布是只认为有一个变量，其它变量都看作常量。

　　X的边缘分布，表示将x看作常量，不管Y的取值：

　　Y的边缘分布，表示将y看作常量，不管x的取值：

　　设(X, Y)的联合密度函数是f(x,y)，那么(X, Y)的联合分布可以表示为：

　　X的边缘分布限定了X的取值是X≤x，y可以取任意值，此时X的边缘分布可以写成：

　　分布代表了累加，连续型分布是用积分表示的，F_X(x)表示P{X≤x, Y<∞}的累加，是对dx的积分，因此X的边缘分布的密度函数是上式的内积分：

　　把u,v换成x,y，X的边缘分布的密度函数是：

　　类似的，Y的边缘分布的密度函数是：

条件分布和条件密度函数

　　条件概率公式：

　　对于连续型变量来说，单点的概率没有意义，因此将上式推广到连续型随机变量后就变成了“分布”，比如给定Y值的条件下X的概率分布。

　　设(X, Y)的联合密度函数是f(x,y)，边缘密度函数是f_X(x)和f_Y(y)，如果固定x，则称下式为X=x条件下Y的概率密度：

　　同样，Y=y条件下X的概率密度：

　　有了概率密度，自然可以求得相应的分布，给定Y值的条件下X的概率分布：

独立性

　　对于二维连续型随机变量(X, Y)来说，如果满足：

　　那么这两个随机变量之间是没有相互影响的，称X和Y之间互相独立。反过来也一样，如果满足了独立性，那么必然有上式的关系。

二维均匀分布

　　设R是平面上的有界区域，面积为A，若二维随机变量(X,Y)具有概率密度：

　　则称(X, Y)在R上服从均匀分布。

　　如果在R区域上x在x₁<x<x₂上服从均匀分布，那么X在x₁<x<x₂的边缘分布的密度函数是：

　　若(X, Y) 服从R区域上的均匀分布，则对于R上的任一子区域D，都有：

　　上式实际上是在说，如果(X,Y)在某个区域内服从均匀分布，则意味着(X,Y)在该区域内具有“等可能”性。

二维正态分布

　　若二维随机变量(X,Y)具有概率密度：

　　则称(X,Y)服从参数为的二维正态分布，记作：

　　f(x,y)的是一个倒钟型曲面：

示例

示例1

　　X服从(0,1)上的均匀分布，在X=x(0<x<1)的条件下，Y在(0,x)内服从均匀分布，f(x,y)=?, 2. f_Y(y)=?

　　先看1，X服从某一个区域的边缘分布意味着：

　　X服从(0,1)上的均匀分布，则x₁ = 0, x₂ = 1：

　　“Y在(0,x)内服从均匀分布”:

　　

　　2. Y的边缘分布的密度函数是：

　　现在只需要确定的积分域即可，由0<y<x<1可知，积分上限是1，下限是y：

示例2

　　设二维随机变量(X, Y)的联合概率密度是：

　　1. A=? 2.求分布函数F(x,y) 3.求概率P{Y≤X}

　　

　　1. 整个定义域上分布函数满足：

　　作者：我是8位的

　　出处：http://www.cnblogs.com/bigmonkey

　　本文以学习、研究和分享为主，如需转载，请联系本人，标明作者和出处，非商业用途！

　　扫描二维码关注公众号“我是8位的”

posted on 2019-06-25 16:50 我是8位的阅读(8404) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

导航

公告