SciTech-Mathmatics-Probability+Statistics:Quantifing Uncertainty_统计分析: SciTech-Mathmatics-Probability+Statistics:Quantifing Uncertainty_统计数据分析: PROBABILITY DISTRIBUTIONS(常用概率分布)

一般数学表示方法

  • 概率数学表示方法

    \(\large \begin{array}{rl} \\ \bm{X}:& 符合某种概率分布的Random\ Variable(随机变量) \\ \bm{x}:& \bm{rnorm}, 随机变量X的一个实例, , … \\ \bm{f}:& \bm{pdf}, \bm{dnorm}, \text{Probability Distribution Function}\ of\ \text{Random Variable }X, … \\ \bm{F}:& \bm{cdf}, \bm{pnorm}, \text{Cumulative Density Function}\ of\ \text{Random Variable }X, … \\ \bm{P(X=k)}:& \bm{pmd}, \text{Probability Mass Distribution} \\ \end{array}\)

  • 常用概率分布

    • Discrete(离散概率分布)

      • Discrete Uniform(离散均匀分布)
      • Bernoulli(伯努利分布)
      • Binomial(二项式分布)
      • Poisson(泊松分布)
      • Hypergeometric(超几何分布)
    • Continuous(连续概率分布)
      • Uniform(均匀分布)
      • Normal/Gaussian(正态分布)
      • Exponential(指数分布)
      • Gamma分布
      • Beta分布
      • Gumbel分布

离散概率分布

Discrete Uniform(离散均匀分布)

  • Definition:每次抽样存在多种可能结果,每种结果出现的概率完全一致.
    即 X的 Sample Space 为 a finite set \(\large S=\{k_1, k_2, \cdots, k_n\}\),
    且 $\large \ P(X=k_i)=\dfrac{1}{n}, \ \forall \ i\ \in [1,\ n], \ i \in N $

  • Example:

    • Roll a die(掷骰子):
      • Sample Space is a finite set: \(\large S=\{1, 2, \cdots, 6\}\)
      • ELO(Equally Likely Outcomes): $P(X=i) = \dfrac{1}{6}, \ \forall i \in {1, 2, \cdots, 6} $
  • R代码:

      >>> x <- sample(c(1,2,6,8,9), 10000, prob=rep(0.2,5),replace=TRUE)
      >>> table(x)## 另一种方法:用index
      >>> idx <- runif(10000,0,5); idx <- ceiling(idx)
      >>> x <- c(1,2,6,8,9)[idx]
      >>> table(x)
    

Bernoulli(伯努利试验)

  • Definition: 仅存在两种可能结果一次 experiment

  • Example:

    • Toss a coin(扔硬币) ONE TIME: H(Head, 正面朝上),T(Tail, 反面朝上)
      \(P(X=H) = \pi, \ \ P(X=T) = 1- \pi\)
  • R代码:

      >>>进行1000次伯努利试验
      >>> outcome <- sample(c(“T”,”F”), 1000, prob=c(0.8, 0.2), replace=TRUE)
      >>> ot <- table(outcome)
      >>> ot <- ot/sum(ot)
    

Binomial

  • Definition:

    • 重复 n次独立 Bernoulli 的 概率分布就是Binomial(二项式)分布:
      • Sample Space 为 \(\large {1, 0}\),
      • 出现 \(\large 1\) 的概率是 \(\large p\),
      • \(\large n\) 次结果有 \(\large X\) 次的 \(\large 1\),
      • \(\large X\) 的可能取值范围是 $\large [1,\ n] \ of \ N $
  • Notation: 记作 \(\large X \sim B(n,p)\)

  • p.f. of \(\large Binomial\):
    \(\large P(X)= C_n^X \pi^X (1-\pi)^{n-X})\)
    \(\large C_n^X = \dfrac{n! }{(n-X)! X!}\)

  • 图形特征

    • \(\large \pi\)接近 \(\large 0.5\) 时,图形是对称的;
    • \(\large \pi\)\(\large 0.5\) 愈远,对称性愈差, 但随 \(\large n\) 的增大, 分布趋于对称.
    • 当 n→∞ 时,只要 \(\large \pi\) 不太靠近 \(\large 0\)\(\large 1\),
      \(\large nP\)\(\large n(1-P)\) 都大于 \(\large 5\) 时, 二项分布 近似于 正态分布
    • 二项分布的图形取决于 \(\large \pi\)\(\large n\) ,高峰在 \(\large \mu = n \pi\)
  • \(\large Binomial\) 示例1
    一个袋子里有5个乒乓球,其中2个黄球,3个白球,我们进行有放回的摸球游戏。
    因此每一次摸到黄球的概率是0.4,摸到白球的概率是0.6。
    这个实验有三个特点:

    1. 各次摸球是彼此独立的;每次摸球只有二种可能的结果,或黄或白;
    2. 重复进行无穷次的相互独立试验。
    3. 每次摸到黄球(或摸到白球)的概率是固定的

    具备这三点后, n次有X次摸到黄球(或白球)的概率分布就是二项分布。

  • Application:
    医学研究上的应用医学研究,很多现象的观察结果是以两分类变量来表示的,
    如阳性与阴性、治愈与未愈、生存与死亡等等。
    如果:

    • 每个观察对象, Positive结果概率均为 \(\large \pi\),Negative结果概率均为 \(\large (1-\pi)\)
    • 而且各个观察对象的结果是相互独立的,
    • 重复观察 n个人,

    发生Positive结果的人数X的概率分布为二项分布,记作\(\large B(X; n,\pi)\).

posted @ 2024-10-07 11:39  abaelhe  阅读(39)  评论(0)    收藏  举报