随笔分类 -  数据算法

关于数据的算法和代码
摘要:```R data 阅读全文
posted @ 2018-11-30 15:43 枫子_dan 阅读(854) 评论(0) 推荐(0)
摘要:概述 aggregate函数应该是数据处理中常用到的函数,简单说有点类似sql语言中的group by,可以按照要求把数据打组聚合,然后对聚合以后的数据进行加和、求平均等各种操作。 构造一个很简单的数据,一组人的性别、年龄和身高,可以用aggregate函数来求不同性别的平均年龄和身高 几个注意点: 阅读全文
posted @ 2018-11-30 15:37 枫子_dan 阅读(545) 评论(0) 推荐(1)
摘要:概述 这个命令表示: 1. frequency=12 表明时间单位为年,而且在每一个时间单位中有12个均匀间隔的观察值。 ​ 因此gm是月数据,在金融数据中,常用的有月收益率数据。 2. start=c(1975,1)表示开始时间为1975年1月。 3. gm应是 列数据 ,而不能是多列金融数据。而 阅读全文
posted @ 2018-11-30 15:28 枫子_dan 阅读(1595) 评论(0) 推荐(0)
摘要:前情需知 指数预测模型 指数模型是用来预测时序未来值的最常用模型。这类模型相对比较简单,但是实践证明它们的短期预测能力较好。不同指数模型建模时选用的因子可能不同。比如 单指数模型(simple/single exponential model)拟合的是只有常数水平项和时间点i处随机项的时间序列,这时 阅读全文
posted @ 2018-11-30 15:24 枫子_dan 阅读(4112) 评论(0) 推荐(0)
摘要:请从上到下安装 numpy importlib pytz python dateutil pandas scipy pasty statemodels backports.functools_lru_cache pyparsing cycler subprocess32 3.5.0rc1 matpl 阅读全文
posted @ 2018-11-30 15:09 枫子_dan 阅读(484) 评论(0) 推荐(0)
摘要:导入包 回归拟合的建立 创建一个线性模型,用我们的X_parameters和Y_parameter训练它。 预测 阅读全文
posted @ 2018-11-30 15:05 枫子_dan 阅读(1410) 评论(0) 推荐(0)
摘要:figure的使用 设置x/y坐标轴刻度 刻度设置 以xticks为例: 获取或者设置当前刻度位置和文本的 x limits: 关键字 ,如果有其他的参数则是 Text 属性。例如,旋转长的文本标注。 Axis containers matplotlib.axis.Axis 对象负责刻度线、格网线、 阅读全文
posted @ 2018-11-30 14:59 枫子_dan 阅读(468) 评论(0) 推荐(0)
摘要:Python图表绘制:matplotlib绘图库入门 matplotlib 简介 matplotlib 是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。 它的文档相当完备,并且Gallery页 阅读全文
posted @ 2018-11-30 14:40 枫子_dan 阅读(422) 评论(0) 推荐(0)
摘要:series Series 是pandas两大数据结构中(DataFrame,Series)的一种。 创建Series Series的定义 :Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。 ​ Series对象本质上是一个Nu 阅读全文
posted @ 2018-11-30 11:39 枫子_dan 阅读(508) 评论(0) 推荐(0)
摘要:mean() 1. mean() 函数定义: mean`(a, axis=None, dtype=None, out=None, keepdims=) "[source\]" Compute the arithmetic mean along the specified axis. Returns 阅读全文
posted @ 2018-11-30 11:05 枫子_dan 阅读(581) 评论(0) 推荐(0)
摘要:求 $$ \Sigma\sideset{^b_a}f(x) $$ 阅读全文
posted @ 2018-11-29 20:26 枫子_dan 阅读(509) 评论(0) 推荐(0)
摘要:```scala def qSort(a:List[Int]):List[Int]={ if(a.length _)) ++ a.filter(a.head == _) ++ qSort(a.filter(a.head 阅读全文
posted @ 2018-11-29 20:20 枫子_dan 阅读(172) 评论(0) 推荐(0)
摘要:冒泡排序 将第一个数字与下一个数字比较,如果第一个数字大,交换两数 tip:先将大的数字往后面放 key:相邻的数字比较 代码块 选择排序 与冒泡排序相反,将较小的数字向前排 找出未排序数组中的最小数的下标,交换 代码块 归并排序 代码块 java public class MergeSort { 阅读全文
posted @ 2018-11-29 15:24 枫子_dan 阅读(170) 评论(0) 推荐(0)
摘要:深入浅出K Means算法 摘要: 在数据挖掘中,K Means算法是一种 cluster analysis 的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。 K Means算法主要解决的问题如下图所示。我们可以看到,在图的左边有一些点,我们用肉眼可以看出来有四个点群, 阅读全文
posted @ 2018-11-29 15:19 枫子_dan 阅读(844) 评论(0) 推荐(0)
摘要:简介 ARIMA: AutoRegressive Integrated Moving Average ARIMA是两个算法的结合:AR和MA。其公式如下: 是白噪声,均值为0, C是常数。 ARIMA的前半部分就是Autoregressive: , 后半部分是moving average: 。 AR 阅读全文
posted @ 2018-11-29 15:08 枫子_dan 阅读(15825) 评论(3) 推荐(0)
摘要:在时间序列中,我们需要基于该时间序列当前已有的数据来预测其在之后的走势,三次指数平滑(Triple/Three Order Exponential Smoothing,Holt Winters)算法可以很好的进行时间序列的预测。 时间序列数据一般有以下几种特点:1.趋势(Trend) 2. 季节性( 阅读全文
posted @ 2018-11-29 14:59 枫子_dan 阅读(8718) 评论(0) 推荐(0)
摘要:一次、二次、三次指数平滑计算思想及代码 概述 一般常用到的指数平滑法为一次指数平滑、二次指数平滑和三次指数平滑,高次指数平滑一般比较难见到,因此本文着重介绍了一次、二次和三次指数平滑的特点与不同。 一次指数平滑一般应用于直线型数据,且一次指数平滑具有滞后性,可以说明有明显的时间性、季节性。 二次指数 阅读全文
posted @ 2018-11-29 14:50 枫子_dan 阅读(1204) 评论(0) 推荐(0)