随笔分类 -  数理统计

包含基础知识及提高部分,以理论为主
摘要:今天整理一下EM算法,当年在学校学这个的时候真是一脸懵逼啊,还好考的不难:) EM(Expectation-Maximization)算法,从名字中就可以知道他是有两部分构成的求期望和求极大似然,论文原文放在这里需要的自取。算法通过迭代的方式进行E步和M步,从而更新模型参数,直到收敛。 预备知识 已 阅读全文
posted @ 2021-04-19 18:24 MrDoghead 阅读(134) 评论(0) 推荐(0)
摘要:曼哈顿距离 描述2点之间的绝对值距离,\(L = |x_1 - x_2| + |y_1 - y_2|\) 欧氏距离 描述2点之间的直线距离,\(L = \sqrt{(x_1-x_2)^2 + (y_1-y_2)^2}\) Pearson相关系数 Pearson 相关系数是用协方差除以两个变量的标准差 阅读全文
posted @ 2021-04-16 00:41 MrDoghead 阅读(166) 评论(0) 推荐(0)
摘要:简介 主成分分析 principal component analysis(PCA) 顾名思义是要提取主要数据信息,这是一种非常常用的数据降维手段,也是分析数据特征的一种方法。本文就简单概述一下这个方法以及如何通过sklearn来使用这个工具。 原理 实际中,不论是机器学习还是数据挖掘,数据的维度都 阅读全文
posted @ 2020-09-22 02:20 MrDoghead 阅读(268) 评论(0) 推荐(0)
摘要:Intro SVD分解是 singular value decomposition的缩写,也就是奇异值分解,它是spectral decomposition谱分解的推广(谱分解适用于方阵)。在机器学习中,这是一种非常有用的降维手段,另外它还可以构建主题词模型,可谓是功能丰富啊。本文通过一个简单的例子 阅读全文
posted @ 2020-09-16 00:39 MrDoghead 阅读(4702) 评论(0) 推荐(1)