随笔分类 - 数据挖掘与分析

分享数据挖掘与分析遇到的问题和知识点
摘要: 运用三角不等式加速Kmeans聚类算法 引言:最近在刷《数据挖掘导论》,第九章, 9.5.1小节有提到,可以用三角不等式,减少不必要的距离计算,从而达到加速聚类算法的目的。这在超大数据量的情况下,尤为重要。但是书中并没有给出解释和证明。本文以k means聚类算法为代表,讲解下怎么利用三角不等式减少阅读全文
posted @ 2017-05-11 20:19 geek精神 阅读(1344) | 评论 (6) 编辑
摘要: Python时间序列数据分析 以示例说明 标签(空格分隔): 时间序列数据分析 本文的内容主要来源于博客:本人做了适当的注释和补充。 https://www.analyticsvidhya.com/blog/2016/02/time series forecasting codes python/ 阅读全文
posted @ 2017-05-09 21:46 geek精神 阅读(31327) | 评论 (34) 编辑
摘要: 什么是 ARIMA模型 ARIMA模型的全称叫做自回归移动平均模型,全称是(ARIMA, Autoregressive Integrated Moving Average Model)。也记作ARIMA(p,d,q),是统计模型(statistic model)中最常见的一种用来进行时间序列 预测的阅读全文
posted @ 2017-05-08 20:22 geek精神 阅读(55885) | 评论 (4) 编辑