2025-10-14 ?
-
wasserstein 距离
定义非常唬人。考虑两个分布 \(p(x),q(x)\)
\[W(p,q) =\inf_{\gamma\sim \pi(p,q)} \mathbb E_{(x,y)\sim \gamma}\left[|x-y|\right] \]其中 \(\pi(p,q)\) 表示所有联合分布 \(\gamma(x,y)\) 满足边缘分布是 \(p,q\) 的 \(\gamma\) 的集合(向 x,y 两维做 projection 得到 p,q)
考虑 \(p,q\) 定义在离散集合 \(1\dots n\) 上,这本质上是一个土壤移动问题。也就是说,初态 \(p_1,\dots p_n\) 单位土,终态 \(q_1\dots q_n\) 单位土,你可以将正实数 x 单位土挪到它相邻的位置上,花费 x,求最小代价。
question: optimal 的 \(\gamma\) 是不是唯一的呢?
这个式子描述的是分布的距离。之前用来描述分布距离的量是 KL 散度。但是 KL 散度有一个致命缺点:如果 p,q 重叠很有限的时候,这个值会非常不合理。所以我们可以使用 wasserstein 距离,来让两个分布之间距离过程性更强一些。(类似训练 rl agent 时给 01 reward 还是给一些 fine grained reward)
-
kurtosis
感觉我看的教程真是没救了
峰高的峰度大这个没问题。
考虑两个 mean variance 都相同的 r.v. ,尾部(极端值)厚重的,肯定 kurtosis 大,在表达式维度容易理解,因为分子是四阶。
那么峰度大也会代表极端值多。那么在金融市场就是黑天鹅时间频繁,风险高。

浙公网安备 33010602011771号