鞅与停时定理学习笔记

本文主要用于作者自己理解,所以很不严谨。

还有很多是抄的别人的博客。

定义:

随机过程:

随机过程 \(X\)\(\{X_0, X_1, X_2...X_n\}\) , \(X_n\) 为随机变量。

可以理解为 \(X_n\) 为随机的过程中第 \(n\) 个时刻的局面,而随机过程就是这些局面所构成的序列。

鞅:

称随机过程 \(X\) 为鞅当且仅当:

  1. \(\forall n \geq 0 , E(|X_n|) < +\infty\)
  2. \(\forall n \geq 0, E(X_{n+1}|X_0,...,X_n) = X_n\)

称随机过程 \(Y\) , 是随机过程 \(X\) 的鞅当且仅当:

  1. \(\forall n \geq 0 , E(|Y_n|) < +\infty\)
  2. \(\forall n \geq 0, E(Y_{n+1}|X_0,...,X_n) = Y_n\)

第一个条件即期望有限,第二个条件即下一次的观测值的期望等于这次观测值。

随机时刻:

设随机变量 \(T\) , 如果 \(T \in N \cup \{+\infty\}\) , 且 \(T=n\) 的示性函数 \(I_{T=n}\)\(X_0,X_1...,X_n\) 的函数,则称 \(T\)\(X\) 的随机时刻.

停时 :

\(T\)\(X\) 的随机时刻且 \(P(T < +\infty) = 1\) 则称 \(T\)\(X\) 的停时。

停止过程:

\(T\)\(X\) 的随机时刻。定义 \(X\) 的停止过程 \(\overline X\)

\[\overline X_n = \begin{cases} X_n \quad(n\leq T)\\ X_T \quad(n > T) \end{cases} \]

显然若 \(X\) 为鞅则 \(\overline X\) 为关于 \(X\) 的鞅。

停时定理

若鞅 \(X\) 和停时 \(T\) 满足以下条件之一:

  1. \(\overline X_n\) 都有界。
  2. \(T\) 有界
  3. \(E(T) < +\infty\) , 且 \(E(|X_{n + 1} - X_n|\;|X_0,...,X_n)\) 有界.

那么 \(E(X_T) = E(X_0)\)

套路:

构造势函数 \(\phi(X)\) , 使得 \(E(\phi(X_{n+1})|X_0, ...,X_n) = \phi(X_n) + 1\) , 这样的话 \(\phi(X_n) - n\) 就是一个鞅, 利用停时定理有 \(E(\phi(X_T)-T) = E(\phi(X_0))=E(\phi(X_T))-E(T)\) , 即 \(E(T)=E(\phi(X_T)) - E(\phi(X_0))\)

这样求出 \(E(\phi(X_0))\)\(E(\phi(X_T))\) 就可以求出 \(E(T)\) 了。

例题:

战争

code

设势函数 \(f(n)\) 表示大小为 \(n\) 的国家的势函数。设整个局面的势函数 \(\sum_{i=1}^{n}f(a_i)\) , 即所有国家的势函数的和.

对于一次战争,设战争双方大小为 \(a\)\(b\) . 另:

\[\begin{aligned} &\quad p(f(a+1)+(b-1)f(1)-f(a)-f(b))+p(f(b+1)+(a-1)f(1)-f(a)-f(b)) + (1-2p)((a+b)f(1)-f(a)-f(b))\\ &=-f(a)-f(b)+pf(a+1)+pf(b+1) + (pb-p+pa-p+a+b-2pa-2pb)f(1)\\ &=1 \end{aligned} \]

\(f(1)=0\) 就可以把后面的一坨都删掉。得到:

\[pf(a+1)-f(a)+p(b+1)-f(b)=1 \]

只需要对于任意的 \(n\) , 让 \(pf(n+1)-f(n)=\frac{1}{2}\) 就行了.

于是有 \(f(n)=\frac{1}{p}f(n-1)+\frac{1}{2p}\)

解这个递归式,有

\[\begin{aligned} f(n)&=p^{1-n}(f(1)-(\frac{\frac{1}{2p}}{\frac{1}{p}-1}))-\frac{\frac{1}{2p}}{\frac{1}{p}-1}\\ &= p^{1-n}(\frac{\frac{1}{2p}}{1-\frac{1}{p}})+\frac{\frac{1}{2p}}{1-\frac{1}{p}}\\ & = (p^{1-n}+1)\frac{1}{2p-2} \end{aligned} \]

可以很容易求出 \(E(\phi(X_0))\)\(E(\phi(X_T))\)

然后这道题要用光速幂.

posted @ 2021-12-12 13:43  youwike  阅读(461)  评论(0编辑  收藏  举报