随笔分类 -  数据挖掘与分析

分享数据挖掘与分析遇到的问题和知识点
摘要:运用三角不等式加速Kmeans聚类算法 引言:最近在刷《数据挖掘导论》,第九章, 9.5.1小节有提到,可以用三角不等式,减少不必要的距离计算,从而达到加速聚类算法的目的。这在超大数据量的情况下,尤为重要。但是书中并没有给出解释和证明。本文以k means聚类算法为代表,讲解下怎么利用三角不等式减少 阅读全文
posted @ 2017-05-11 20:19 geek精神 阅读(3825) 评论(6) 推荐(2) 编辑
摘要:Python时间序列数据分析 以示例说明 标签(空格分隔): 时间序列数据分析 本文的内容主要来源于博客:本人做了适当的注释和补充。 https://www.analyticsvidhya.com/blog/2016/02/time series forecasting codes python/ 阅读全文
posted @ 2017-05-09 21:46 geek精神 阅读(76843) 评论(37) 推荐(7) 编辑
摘要:什么是 ARIMA模型 ARIMA模型的全称叫做自回归移动平均模型,全称是(ARIMA, Autoregressive Integrated Moving Average Model)。也记作ARIMA(p,d,q),是统计模型(statistic model)中最常见的一种用来进行时间序列 预测的 阅读全文
posted @ 2017-05-08 20:22 geek精神 阅读(148197) 评论(7) 推荐(23) 编辑