2025-10-14 ?

  1. wasserstein 距离

    定义非常唬人。考虑两个分布 \(p(x),q(x)\)

    \[W(p,q) =\inf_{\gamma\sim \pi(p,q)} \mathbb E_{(x,y)\sim \gamma}\left[|x-y|\right] \]

    其中 \(\pi(p,q)\) 表示所有联合分布 \(\gamma(x,y)\) 满足边缘分布是 \(p,q\)\(\gamma\) 的集合(向 x,y 两维做 projection 得到 p,q)

    考虑 \(p,q\) 定义在离散集合 \(1\dots n\) 上,这本质上是一个土壤移动问题。也就是说,初态 \(p_1,\dots p_n\) 单位土,终态 \(q_1\dots q_n\) 单位土,你可以将正实数 x 单位土挪到它相邻的位置上,花费 x,求最小代价。

    question: optimal 的 \(\gamma\) 是不是唯一的呢?

    这个式子描述的是分布的距离。之前用来描述分布距离的量是 KL 散度。但是 KL 散度有一个致命缺点:如果 p,q 重叠很有限的时候,这个值会非常不合理。所以我们可以使用 wasserstein 距离,来让两个分布之间距离过程性更强一些。(类似训练 rl agent 时给 01 reward 还是给一些 fine grained reward)

  2. kurtosis

    感觉我看的教程真是没救了

    峰高的峰度大这个没问题。

    考虑两个 mean variance 都相同的 r.v. ,尾部(极端值)厚重的,肯定 kurtosis 大,在表达式维度容易理解,因为分子是四阶。

    那么峰度大也会代表极端值多。那么在金融市场就是黑天鹅时间频繁,风险高。

posted @ 2025-10-14 14:42  没学完四大礼包不改名  阅读(28)  评论(1)    收藏  举报