机器学习 - 随笔分类 - C_noized

机器学习-12-隐马尔可夫模型HMM

摘要：隐马尔可夫模型隐马尔可夫模型是一种概率图模型。我们知道，机器学习模型可以从频率派和贝叶斯派两个方向考虑，在频率派的方法中的核心是优化问题，而在贝叶斯派的方法中，核心是积分问题，也发展出来了一系列的积分方法如变分推断，MCMC 等。概率图模型最基本的模型可以分为有向图（贝叶斯网络）和无向图（马尔可夫阅读全文

posted @ 2025-06-07 17:24 C_noized 阅读(248) 评论(0) 推荐(0)

机器学习-11-马尔科夫链蒙特卡洛MCMC

摘要：马尔可夫链蒙特卡洛 MCMC 是一种随机的近似推断，其核心就是基于采样的随机近似方法蒙特卡洛方法。对于采样任务来说，有下面一些常用的场景：采样作为任务，用于生成新的样本求和/求积分采样结束后，我们需要评价采样出来的样本点是不是好的样本集：样本趋向于高概率的区域样本之间必须独立具体采样中，阅读全文

posted @ 2025-06-06 10:38 C_noized 阅读(296) 评论(0) 推荐(0)

机器学习-10-变分推断VI

摘要：变分推断贝叶斯派最核心的问题就是求后验分布，由贝叶斯公式，实际上就是要求边缘概率，因为分子的似然和先验都是容易求的，而边缘概率是一个积分（就是分子的积分），如果隐变量维度太高，或者这个积分的形式复杂，都会导致积分难求。如果积分比较好求，那就是精确推断，如果积分不好求，那就只能用近似推断，变分推断就阅读全文

posted @ 2025-06-04 19:57 C_noized 阅读(324) 评论(0) 推荐(0)

机器学习-09-高斯混合模型GMM

摘要：高斯混合模型为了解决高斯模型的单峰性的问题，我们引入多个高斯模型的加权平均来拟合多峰数据： \[p(x)=\sum\limits_{k=1}^K\alpha_k\mathcal{N}(\mu_k,\Sigma_k) \]引入隐变量 \(z\)，这个变量表示对应的样本 \(x\) 属于哪一个高斯分布阅读全文

posted @ 2025-05-26 21:45 C_noized 阅读(281) 评论(0) 推荐(0)

机器学习算法补充

摘要：梯度提升树-GBDT 梯度提升树（GBDT）是一种基于Boosting思想的集成学习算法，通过迭代训练多棵决策树（通常为CART回归树）来逐步优化模型预测性能。 CART（分类与回归树）是一种基于二叉树的决策树算法，分类问题：基尼指数（Gini Index）衡量数据不纯度的指标，算法选择使基尼指数最阅读全文

posted @ 2025-05-26 16:38 C_noized 阅读(68) 评论(0) 推荐(0)

机器学习-08-EM算法

摘要：期望最大期望最大算法的目的是解决具有隐变量的混合模型的参数估计（极大似然估计）。MLE 对 \(p(x|\theta)\) 参数的估计记为：\(\theta_{MLE}=\mathop{argmax}\limits_\theta\log p(x|\theta)\)。EM 算法对这个问题的解决方法是阅读全文

posted @ 2025-05-24 21:34 C_noized 阅读(38) 评论(0) 推荐(0)

机器学习-07-概率图模型

摘要：概率图模型概率图模型使用图的方式表示概率分布，因为各个变量的概率之间可能存在着各种各样的依赖关系，用图来表示是一种自然的想法。为了在图中添加各种概率，首先总结一下随机变量分布的一些规则： \[\begin{align*} &Sum\ Rule:p(x_1)=\int p(x_1,x_2)dx_2\ 阅读全文

posted @ 2025-05-19 11:33 C_noized 阅读(85) 评论(0) 推荐(0)

机器学习-06-指数族分布

摘要：指数族分布指数族是一类分布，包括高斯分布、伯努利分布、二项分布、泊松分布、Beta 分布、Dirichlet 分布、Gamma 分布等一系列分布。指数族分布可以写为统一的形式： \[p(x|\eta)=h(x)\exp(\eta^T\phi(x)-A(\eta))=\frac{1}{\exp(A( 阅读全文

posted @ 2025-05-19 11:30 C_noized 阅读(200) 评论(0) 推荐(0)

机器学习-05-SVM

摘要：支撑向量机 SVM有三宝，间隔对偶核技巧~ 支撑向量机（SVM）算法在分类问题中有着重要地位，其主要思想是最大化两类之间的间隔。按照数据集的特点：线性可分问题，如之前的感知机算法处理的问题线性可分，只有一点点错误点，如感知机算法发展出来的 Pocket 算法处理的问题非线性问题，完全不可分，如阅读全文

posted @ 2025-05-19 09:57 C_noized 阅读(43) 评论(0) 推荐(0)

机器学习-04-降维

摘要：降维我们知道，解决过拟合的问题除了正则化和添加数据之外，降维就是最好的方法。降维的思路来源于维度灾难的问题，我们知道 \(n\) 维球的体积为： \[CR^n \]那么在球体积与边长为 \(2R\) 的超立方体比值为： \[\lim\limits_{n\rightarrow0}\frac{CR^n 阅读全文

posted @ 2025-04-15 17:09 C_noized 阅读(15) 评论(0) 推荐(0)

机器学习-03-线性分类

摘要：线性分类对于分类任务，线性回归模型就无能为力了，但是我们可以在线性模型的函数进行后再加入一层激活函数，这个函数是非线性的，激活函数的反函数叫做链接函数。我们有两种线性分类的方式：硬分类，直接输出观测对应的分类。这类模型的代表为：线性判别分析（Fisher 判别）感知机软分类，产生不同类别的阅读全文

posted @ 2025-04-15 16:36 C_noized 阅读(26) 评论(0) 推荐(0)

机器学习-02-线性回归

摘要：线性回归假设数据集为： \[\mathcal{D}=\{(x_1, y_1),(x_2, y_2),\cdots,(x_N, y_N)\} \]后面我们记： \[X=(x_1,x_2,\cdots,x_N)^T,Y=(y_1,y_2,\cdots,y_N)^T \]线性回归假设： \[f(w)=w 阅读全文

posted @ 2025-04-14 20:45 C_noized 阅读(68) 评论(0) 推荐(0)

机器学习-01-基础知识

摘要：基础知识数据集和学习数据集的矩阵表示： \[X_{N\times p}=(x_{1},x_{2},\cdots,x_{N})^{T},x_{i}=(x_{i1},x_{i2},\cdots,x_{ip})^{T} \]即表示有 \(N\) 个样本，每个样本都是 \(p\) 维向量，每个维度称作属阅读全文

posted @ 2025-04-14 20:43 C_noized 阅读(49) 评论(0) 推荐(0)

Loading

C_noized's Blog

随笔分类 - 机器学习

公告