千里路 - 随笔分类 - 分析101

依分布收敛的定义细节

摘要：1 定义依分布收敛的定义是这样的：随机变量序列${X_n}{n=1}^{\infty}$，若它们的累积分布函数cdf序列${F_1}{n=1}^{\infty}$，与某个随机变量$X$的cdf $F$，满足 \[ \lim_{n\to\infty} F_n(x)=F(x) \] 在任意$F 阅读全文

posted @ 2021-09-28 12:59 分析101 阅读(1335) 评论(0) 推荐(0)

Jensen不等式及其应用

摘要：Jensen不等式的形式有很多种，这里重点关注有关于随机变量期望的形式。 1 Jensen不等式 Jensen不等式：已知函数$\phi: \mathbb{R}\to\mathbb{R}$为凸函数，则有$\phi[\text{E}(X)]\leq \text{E}[\phi(X)]$。有时候，阅读全文

posted @ 2021-08-12 20:16 分析101 阅读(3249) 评论(0) 推荐(0)

最小角回归详解

摘要：本文介绍LAR（Least angle regression，最小角回归），由Efron等（2004）提出。这是一种非常有效的求解LASSO的算法，可以得到LASSO的解的路径。 1 算法介绍我们直接看最基本的LAR算法，假设有$N$个样本，自变量是$p$维的：先对$X$（\(N\times p 阅读全文

posted @ 2021-06-29 17:34 分析101 阅读(1237) 评论(0) 推荐(0)

QR分解与线性回归

摘要：1 一元回归与多元回归任何一本初级水平的计量经济学、统计学或机器学习相关书籍，都会详细推导多元线性线性回归的解，在这里就不再赘述。我们给出本文用到的一些设定。$y$为$N$维因变量向量，假设$y=X\beta+\epsilon$，如果自变量为$p$维，将$X$排为$N\times (p+1)$矩阅读全文

posted @ 2021-06-24 17:40 分析101 阅读(797) 评论(0) 推荐(0)

Curse of Dimensionality

摘要：1 Curse of dimensionality 我们知道，$k$-NN算法是一种非常简单又很有效果的算法，它的核心思想就是局部近似。究其原因，就是因为它可以很好地对条件期望进行近似，一方面它用样本均值代替了期望，另一方面它用给定某个点的邻域代替了该点，结合起来，就是用在邻域内的样本均值，取代阅读全文

posted @ 2021-06-22 16:08 分析101 阅读(183) 评论(0) 推荐(0)

LASSO的解法

摘要：LASSO非常实用，但由于它的惩罚项不可以常规地进行求导，使得很多人以为它无法显式地求出解析解。但其实并不是这样的。 1 单变量情形：软阈值法 1.1 软阈值的分类讨论将$N$个样本的真实值记为$N$维向量$y$，将$N$个样本的自变量记为$z$，假设我们已经将自变量做过标准化，即$z' \ell 阅读全文

posted @ 2021-06-17 15:56 分析101 阅读(2076) 评论(0) 推荐(0)

经验分布函数简介

摘要：1 概念如果我们想知道某个随机变量$X$的分布$F$，这在一般情况下当然是无法准确知道的，但如果我们手上有它的一些独立同分布的样本，可不可以利用这些样本？一个很简单的办法就是，把这些样本的“频率”近似为随机变量的“概率”。经验分布函数（empirical distribution functio 阅读全文

posted @ 2021-06-15 14:20 分析101 阅读(3654) 评论(0) 推荐(0)

Hoeffding不等式简介

摘要：1 Hoeffding不等式 Hoeffding不等式是非常有用的一个不等式，在机器学习、统计学等领域，都发挥着巨大的作用。它的思想与Markov不等式有些类似，我们先给出它的形式： Hoeffding不等式：$Y_1,\ldots,Y_n$为独立观测，$E(Y_i)=0$，\(a_i\leq 阅读全文

posted @ 2021-06-14 19:35 分析101 阅读(1198) 评论(0) 推荐(0)

正态分布密度函数的系数

摘要：正态分布的密度函数，可以一般化地写为 \[ f(x) = k \exp\left[-\dfrac{1}{2}(x-b)' A (x-b)\right] \] 事实上，如果某个多维随机变量的密度函数可以写成该形式，那么它就服从正态分布。其中$b$是均值，正定矩阵$A$是协方差矩阵的逆，它们共同决定的正阅读全文

posted @ 2021-06-10 23:13 分析101 阅读(763) 评论(0) 推荐(0)

条件期望误差的有限性

摘要：1 CEF error的有限性问题在回归中，记条件期望函数（conditional expectation function，CEF）为$E[Y|X=x]$，则可将因变量$Y$分解为 \[ Y=E[Y|X=x]+e \] 可记$e=Y-E[Y|X=x]$为条件期望函数误差（CEF error）。阅读全文

posted @ 2021-06-05 13:24 分析101 阅读(370) 评论(0) 推荐(0)

数据标准化

摘要：1 为何需要标准化有的数据，不同维度的数量级差别较大，导致有的维度会主导整个分析过程。如下图所示：该图的数据维度$d=30$，样本量$n=40$，上面的图是对原始数据做PCA后，第一个PC在各个维度上的权重的平行坐标图，下面的图则是对数据做标准化之后的情况。可以发现，在原始数据中，第$4$和$2 阅读全文

posted @ 2021-05-17 19:35 分析101 阅读(1071) 评论(0) 推荐(0)

平行坐标图简介

摘要：高维数据的可视化是一个很大的问题，Inselberg（1985）提出了一种好办法，称为平行坐标图（parallel coordinate plots）。它有竖直的（vertical）和水平的（horizontal）两种画法。 Vertical parallel coordinate plots：对于阅读全文

posted @ 2021-05-14 12:32 分析101 阅读(676) 评论(0) 推荐(0)

工具变量原理

摘要：在做回归时，很多时候会有$\text(x_t \varepsilon_t)\neq 0$的情况，这也意味着不满足外生性条件$\text(\varepsilon|X)=0$，此时的OLS估计量$\hat\beta$就不再满足无偏性，并且随着$n$的变大，它的bias也无法变小。若对此无法理解，请先掌握阅读全文

posted @ 2021-04-25 13:53 分析101 阅读(1073) 评论(0) 推荐(0)

方差分解公式

摘要：在有些时候，直接计算随机变量的方差非常麻烦，此时可以用方差分解公式，将方差分解为条件期望的方差加条件方差的期望： \[ \text{Var}(X)=\text{Var}[\text{E}(X|Y)]+\text{E}[\text{Var}(X|Y)] \] 证明非常简单，注意到 \[ \begin{ 阅读全文

posted @ 2021-04-21 17:11 分析101 阅读(4104) 评论(0) 推荐(0)

行列式的求导

摘要：在应用中，经常会碰到需要对某个矩阵的行列式进行求导的情况。而行列式的计算方法比较复杂，如果将它展开成后计算，会比较麻烦，因此最好直接记住一些结论。本文以计算$\dfrac{\partial |A|}{\partial A}$和$\dfrac{\partial \ln |A|}{\partial 阅读全文

posted @ 2021-04-19 17:11 分析101 阅读(4252) 评论(0) 推荐(2)

几乎必然收敛的含义

摘要：1 几乎必然收敛的概念几乎必然收敛（almost sure convergence），又叫以概率1收敛（convergence with probability 1），定义为：随机变量序列${X_n}$满足 \[ \mathbf{P}(\lim_{n\to \infty} X_n\to X)=1 阅读全文

posted @ 2021-04-15 22:43 分析101 阅读(3537) 评论(0) 推荐(0)

正态分布的条件分布与边缘分布

摘要：本文总结多元正态分布的条件分布与边缘分布，证明不难，但都比较繁琐，故不做详细证明，有兴趣可以参考Pattern Recognition and Machine Learningy一书。 1 正态分布的条件分布对于联合正态分布变量$x\sim N(\mu,\Sigma)\(，定义精度矩阵（the p 阅读全文

posted @ 2021-04-14 13:39 分析101 阅读(3873) 评论(0) 推荐(0)

多元正态分布初识

摘要：在本科阶段的教材中，往往会有多元正态分布的公式出现，但课堂上都不会重点讲解，而在研究生入学考试中也基本不会考。但在实际应用中，多元的情况却非常常见。本文通过对多元正态分布的公式进行拆解，来正式认识一下它。 1 多元正态分布公式对于$D$维正态分布变量$x$，直接上它的密度公式： \[ \math 阅读全文

posted @ 2021-04-13 13:23 分析101 阅读(822) 评论(0) 推荐(0)

利用矩母函数求独立随机变量之和的分布

摘要：在求独立的随机变量之和的分布时，可用矩母函数法。 1 矩母函数法定理已知$X_1,\ldots,X_n$为独立的随机变量，各种的矩母函数为$M_1,\ldots,M_n$，$a_1,\ldots,a_n$为常数，则$Y=\sum_^a_i X_i$的矩母函数为 \[ M_Y(t)=\text{E 阅读全文

posted @ 2021-04-12 20:59 分析101 阅读(1858) 评论(0) 推荐(0)

Cauchy-Schwarz不等式、Hölder不等式与Minkowski不等式

摘要：本文介绍几个常用的与期望有关的不等式。 1 Cauchy–Schwarz不等式 Cauchy–Schwarz不等式有许多形式，这里只介绍它的期望函数的形式。 Cauchy–Schwarz不等式： \[ [\text{E}(XY)]^2 \leq \text{E}(X^2)\text{E}(Y^2) 阅读全文

posted @ 2021-04-08 15:30 分析101 阅读(4589) 评论(0) 推荐(1)

随笔分类 - 千里路

公告