随笔分类 - 机器学习
摘要:机器学习算法-HMM 1. 模型定义 隐马尔可夫模型(HMM)是一个关于时序的概率模型,是一种特殊的概率图模型。该图模型包含了两个序列:状态序列${z_1, z_2, ..., z_T}\(和观测序列\){x_1, x_2, ..., x_T}$,取值分别来自于状态集合$Q={q_1, q_2,
阅读全文
摘要:机器学习算法-VAE 1. VAE模型推导 1.1 算法引入 在EM算法中,隐变量的最优分布$q^{\star}(\mathbf)$是在观测数据给定时的条件分布$p(\mathbf|\mathbf)$,此时对应的证据下界与似然函数相等。但是在实际中,后验概率可能很难计算甚至不能计算,这时EM算法
阅读全文
摘要:机器学习算法-GMM和EM算法 1. GMM模型 聚类问题是一个经典的无监督任务,其目标是将 \(N\) 个 \(D\) 维数据 \(\{\bf{x}_i\}_{i=1}^N\) 分成$K$个簇,使得每个簇中的样本尽可能相似。GMM算法对数据分布做了一些假设: 第$k$个簇数据点服从正态分布,即
阅读全文
摘要:机器学习算法——SVM 1. 背景 在线性分类任务中,对于同一个数据集,可能有多个分离超平面。例如在下图中,H2和H3都能够将白色点和黑色点分离开来,那么在这些分界面中,是否存在一个最优的分界面?一个直观的想法是,离所有点都比较远的分割面会是一个好的分割面。可以证明,这样的最优分割面是唯一的。因
阅读全文
摘要:机器学习之树模型 大纲 决策树和回归树模型:ID3, C4.5,CART AdaBoost框架 提升树:梯度提升树 决策树 决策树模型可以看做是if-else指令集合,通过对特征空间的划分来完成分类或者回归任务。以下图中的分类任务为例,假设数据集包含了: 三个类别:黄色、蓝色、绿色 两个维度的特征空
阅读全文
摘要:机器学习算法——kNN 1. 算法原理 基本思想是物以类聚,相同类别的样本之间在特征空间中应当聚集在一起,因此对于新的数据点,根据其附近的K个邻居的类型可以对其进行预测。如下图所示,假设红、绿、蓝三种颜色的点分布在二维空间中,这对应着分类任务中的训练样点包含了3个类别,特征数量为2。如果现在我们希望
阅读全文

浙公网安备 33010602011771号