随笔分类 - 数理统计
包含基础知识及提高部分,以理论为主
摘要:今天整理一下EM算法,当年在学校学这个的时候真是一脸懵逼啊,还好考的不难:) EM(Expectation-Maximization)算法,从名字中就可以知道他是有两部分构成的求期望和求极大似然,论文原文放在这里需要的自取。算法通过迭代的方式进行E步和M步,从而更新模型参数,直到收敛。 预备知识 已
阅读全文
摘要:曼哈顿距离 描述2点之间的绝对值距离,\(L = |x_1 - x_2| + |y_1 - y_2|\) 欧氏距离 描述2点之间的直线距离,\(L = \sqrt{(x_1-x_2)^2 + (y_1-y_2)^2}\) Pearson相关系数 Pearson 相关系数是用协方差除以两个变量的标准差
阅读全文
摘要:简介 主成分分析 principal component analysis(PCA) 顾名思义是要提取主要数据信息,这是一种非常常用的数据降维手段,也是分析数据特征的一种方法。本文就简单概述一下这个方法以及如何通过sklearn来使用这个工具。 原理 实际中,不论是机器学习还是数据挖掘,数据的维度都
阅读全文
摘要:Intro SVD分解是 singular value decomposition的缩写,也就是奇异值分解,它是spectral decomposition谱分解的推广(谱分解适用于方阵)。在机器学习中,这是一种非常有用的降维手段,另外它还可以构建主题词模型,可谓是功能丰富啊。本文通过一个简单的例子
阅读全文

浙公网安备 33010602011771号