摘要: 使用numpy可以做很多事情,在这篇文章中简单介绍一下如何使用numpy进行方差/标准方差/样本标准方差/协方差的计算。 variance: 方差 方差(Variance)是概率论中最基础的概念之一,它是由统计学天才罗纳德·费雪1918年最早所提出。用于衡量数据离散程度,因为它能体现变量与其数学期望 阅读全文
posted @ 2020-03-20 14:28 lonelyshy 阅读(25077) 评论(0) 推荐(2) 编辑
摘要: 原文链接:https://blog.csdn.net/fjssharpsword/article/details/74911180 知识点:数据分布特征的描述1、变量集中趋势的测定 变量在不同个体或不同时间条件下具体表现出来的数据是不同的,不过众多个体的数据常常会呈现出在一定范围内围绕某个中心而波动 阅读全文
posted @ 2020-03-20 14:11 lonelyshy 阅读(6802) 评论(0) 推荐(0) 编辑
摘要: 原文链接:https://www.cnblogs.com/chaosimple/p/4153167.html 感谢作者,解决了我的疑惑 一、标准化(Z-Score),或者去除均值和方差缩放 公式为:(X-mean)/std 计算时对每个属性/每列分别进行。 将数据按期属性(按列进行)减去其均值,并处 阅读全文
posted @ 2020-03-20 14:06 lonelyshy 阅读(622) 评论(0) 推荐(0) 编辑
摘要: 原文链接:https://blog.csdn.net/pipisorry/article/details/72820982 考察评估数值数据散布或发散的度量。这些度量包括极差、分位数、四分位数、百分位数和四分位数极差。五数概括可以用盒图显示,它对于识别离群点是有用的。方差和标准差也可以指出数据分布的 阅读全文
posted @ 2020-03-20 13:48 lonelyshy 阅读(2126) 评论(0) 推荐(0) 编辑
摘要: 原文链接:https://blog.csdn.net/hqh131360239/article/details/79061535 1、linalg=linear(线性)+algebra(代数),norm则表示范数。 2、函数参数 x_norm=np.linalg.norm(x, ord=None, 阅读全文
posted @ 2020-03-20 13:26 lonelyshy 阅读(514) 评论(0) 推荐(0) 编辑
摘要: 转载:https://blog.csdn.net/liukuan73/article/details/80494779 详细: 1.闵可夫斯基距离(Minkowski Distance) 2.欧氏距离(Euclidean Distance) 3.曼哈顿距离(Manhattan Distance) 4 阅读全文
posted @ 2020-03-20 13:21 lonelyshy 阅读(6256) 评论(0) 推荐(0) 编辑