一维随机变量
随机变量
- 设 \(\Omega\) 为某随机现象的样本空间, \(\mathcal{F}\) 为事件域,称定义 \(\Omega\) 上的实值函数\(X=X(\omega)\) 为随机变量,若对任意的实数\(x\) ,\(\{\omega\in\Omega:X(\omega)\leq x\}\in\mathcal{F}\) .
- 随机变量是函数,随机变量实现的映射是:(定义域)事件域\(\Omega\) \(\rightarrow\) (值域) 实数域\(\mathbb R\)。
- 称只有两个可能取值的随机变量为Bernoulli随机变量:如抛硬币
- 分类:
- 离散随机变量:可能的取值为有限个,可列。
- 连续随机变量:可能的取值无限,充满某个区间,不可列。
分布函数
- 设 \(X\) 为随机变量,对任意的实数 \(x\) ,称函数 \(F(x)=P(X\leq x)\) 为 \(X\) 的分布函数.
基本性质:
- 单调不降:\(F(x_1) \le F(x_2)\),\(x_1<x_2\)
- 有界性:\(0\le F(x) \le 1\),\(F(\infty) = 1\),\(F(-\infty) = 0\)
- 右连续性:\(F(x+0) = \lim_{\Delta x \rightarrow 0^+} F(x+\Delta x) = F(x)\)
分布函数计算概率
- \(P(X\le x) = F(x)\)
- \(P(X>x) = 1-F(x)\)
- \(P(X<x) = F(x-0)\)
- \(P(X\ge x) =1-F(x-0)\)
- \(P(X=x) = F(x) - F(x-0)\)
- \(P(a< X \le b) = F(b) -F(a)\)
- \(P(a \le X \le b) = F(b) - F(a-0)\)
- \(P(a< X < b) = F(b-0)-F(a)\)
- \(P(a \le X < b) = F(b-0)-F(a-0)\)
离散随机变量的分布列
设离散随机变量 \(X\) 的可能取值为 \(x_{1},x_{2},\cdots,x_{n},\cdots,\) 称 \(p_{k}=P(X=x_{k}),k=1,2,\cdots\) 为 \(X\) 的分布列. 分布列也可以用表格形式表示.
分布列的性质
- 非负性:\(p_k>0\),\(k=0,1,2,\cdots\)
- 正则性:\(\sum_{k=1}^{\infty} p_k = 1\)
已知分布列求分布函数
设离散型随机变量 \(X\) 具有分布列 \(p_k=P(X=x_k),\quad k=1,2\cdots\)
则 \(X\) 的分布函数为
已知分布列求概率
设离散型随机变量 \(X\) 具有分布列 \(p_k=P(X=x_k),\quad k=1,2\cdots\)
则
离散随机变量分布函数的特征
- 设 \(F(x)\) 是离散随机变量 \(X\) 的分布函数,则\(F(x)\)
- 是单调不降的阶梯函数
- 在其间断点处为右连续的
- 间断点为 \(X\) 的可能取值点
- 在间断点的跳跃高度是对应的概率值。
已知分布函数求分布列
设 \(F(x)\) 是离散随机变量 \(X\) 的分布函数,其间断点为 \(x_1,x_2,\cdots\)
则分布列为
常用离散分布
二项分布
设 \(X\) 为 \(n\) 重Bernoulli试验中成功的次数,则
称 \(X\) 服从参数为 \((n,p)\) 的二项分布,记为 \(X\sim b(n,p)\) .
当 \(n=1\) 时,称 \(b(1,p)\) 为两点分布或0-1分布.
几何分布
设 \(X\) 表示做贝努利试验中首次成功时的总试验次数,则 \(X\) 具有分布列
称 \(X\) 服从参数为 \(p\) 的几何分布,记为 \(X\thicksim\mathrm{Ge}(p)\)
几何分布的无记忆性
设 \(X \sim Ge(p)\),则
无记忆性表明:在一列贝努利试验中,已知在前m次未成功的条件下,接下去的n次试验中仍未成功的概率与已经失败的次数m无关.
负二项分布
设 \(X\) 表示做贝努利试验中第 \(r\) 次成功时的总试验次数,则 \(X\) 具有分布列
称 \(X\) 服从参数为 \((r,p)\) 的负二项分布或帕斯卡(Pascal)分布,记为 \(X\thicksim Nb(r,p)\).
几何分布是特殊的负二项分布,\(Nb(1,p) = Ge(p)\)
泊松分布
泊松分布通常刻画稀有事件发生的次数或个数。
若随机变量 \(X\) 有分布列
则称 \(X\) 服从参数为 \(\lambda\) 的泊松分布,记为 \(X\sim P(\lambda)\)
超几何分布
若随机变量 \(X\) 有分布列
其中 \(n\leq N,k\leq M,n-k\leq N-M\) ,则称 \(X\) 服从参数为 \((n,N,M)\) 的超几何分布记为 \(X\sim h(n,N,M)\) .
超几何分布对应于不返回抽样模型:\(N\)个产品中有\(M\)个不合格品,从抽取\(n\)个,不合格品的个数\(X\).
连续随机变量
设随机变量\(X\)的分布函数为\(F(x)\). 若存在函数\(p(x)\),使得对任意的 \(x\),\(F(x)=\int_{-\infty}^{x}p(t)dt\) 成立,则称 \(X\) 为连续随机变量. 称\(p(x)\) 为概率密度函数或简称为密度函数
连续随机变量分布函数的性质
- 连续随机变量的分布函数 \(F\) 一定为连续函数.
- \(P(X=a) = F(a) - F(a-0) = 0\)
- \(\int_a^b p(t)dt =F(b)-F(a)\)
- \(P(a< X \le b)=P(a \le X \le b)=P(a\le X < b)=P(a<X<b)\)
- 若\(F(x)\) 在 \(x\) 处可导 , 则 \(F^{\prime}(x)=p(x)\) ,不可导时,可令 \(p(x)=0\) 。连续随机变量的密度函数不是唯一的.
概率密度函数的性质
- 非负性:\(p(x)\ge 0\)
- 正则性:\(\int_{-\infty}^{\infty} p(x)dx = 1\)
概率密度函数求概率
概率密度函数偶函数性质
设随机变量\(X\)的概率密度函数为偶函数\(p(-x)=p(x)\),有
常用连续分布
正态分布
记作 $$X\sim N(\mu,\sigma^2)$$
其中尺度参数\(\sigma > 0\),位置参数\(\mu\) 为任意实数
正态分布概率密度函数性质
- \(p(x)\)关于直线\(x=\mu\)对称,且在\(\mu\)处取得最大值。
- 若\(\sigma\)不变,\(\mu\)改变,则\(p(x)\) 图像沿x轴左右移动,但形状保持不变.
- 若\(\mu\)不变,\(\sigma\)改变,则\(p(x)\)图像对称轴位置不变,但陡峭程度发生改变.
标准正态分布
当\(\mu = 0\),\(\sigma = 1\)时的正态分布,即\(X\sim N(0,1)\),为标准正态分布。
其概率密度函数为
其分布函数无法用初等函数表示,将其分布函数记作\(\Phi(x)\) ,计算通过查表可得(数值解)
显然\(\Phi(x)\) 为偶函数,\(\Phi(0)=\frac{1}{2}\),\(\Phi(x)+\Phi(-x)=1\)
正态分布标准化
若\(X \sim N (\mu,\sigma^2)\),则
通过正态分布标准化,可以将任意正态分布分布函数转化为标准正态分布函数通过查表求概率。
正态分布\(3\sigma\)原则
设\(X\sim N(\mu,\sigma^2)\),,则
均匀分布
概率密度函数为
则分布函数为
记作\(X\sim U(a,b)\),\(X\) 服从于均匀分布
指数分布
概率密度函数
分布函数
记作\(X\sim Exp(\lambda)\),其中\(\lambda > 0\)
- 指数函数具有无记忆性,\(P(X>s+t|X>s)=P(X>t).\)
伽马分布
概率密度函数
记作\(X\sim Ga(\alpha ,\lambda)\),\(\alpha>0,\lambda>0\)
- \(Ga(1,\lambda) = Exp(\lambda)\)
- \(Ga(\frac{n}{2},\frac{1}{2}) = \chi^2 (n)\)
其中\(\Gamma(x)\)为伽马函数
- \(\Gamma(x) = \int_0^{\infty} t^{x-1}e^{-t}dt\)
- \(\Gamma(1)=1\),\(\Gamma(\frac{1}{2})=\sqrt \pi\),
- \(\Gamma(x+1)=x\Gamma(x)\),
- \(\Gamma(x+1) = x!\)
柯西分布
概率密度函数
分布函数
幂律分布
概率密度函数
称\(X\)服从参数为\(\gamma\)的幂律分布(power law),其中参数 \(\gamma>1\) 为幂律指数。

浙公网安备 33010602011771号