09 2019 档案
摘要:1、__ init__(): 所有类的超类object,有一个默认包含pass的__ init __()实现,这个函数会在对象初始化的时候调用,我们可以选择实现,也可以选择不实现,一般建议是实现的,不实现对象属性就不会被初始化,虽然我们仍然可以对其进行赋值,但是它已经成了隐式的了,编程时显示远比隐式
阅读全文
摘要:多项式回归 若希望回归模型更好的拟合训练样本数据,可以使用多项式回归器。 一元多项式回归 y=w0 + w1 x + w2 x2 + w3 x3 + ... + wd xd 将高次项看做对一次项特征的扩展得到: y=w0 + w1 x1 + w2 x2 + w3 x3 + ... + wd xd 那
阅读全文
摘要:索引目录 1.机器学习 2.机器学习 3.线性回归
阅读全文
摘要:线性回归 预测函数:y = w0+w1x x: 输入 y: 输出 w0和w1: 模型参数 所谓模型训练,就是根据已知的x和y,找到最佳的模型参数w0 和 w1,尽可能精确地描述出输入和输出的关系。 5.0 = w0 + w1 × 0.5 5.5 = w0 + w1 × 0.6 单样本误差: 根据预测
阅读全文
摘要:机器学习 概述 什么是机器学习 机器学习是一门能够让编程计算机从数据中学习的计算机科学。 一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现,也就是用以衡量的P,随着E增加而增加,那么这样计算机程序就被称为机器学习系统。 自我完善,自我增进,自我适应。 为什么需要机器学
阅读全文
摘要:Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。使用浏览器作为界面,向后台的IPython服务器发送请求,并显示结果。 Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支
阅读全文
摘要:pandas描述性统计 数值型数据的描述性统计主要包括了计算数值型数据的完整情况、最小值、均值、中位 数、最大值、四分位数、极差、标准差、方差、协方差等。在NumPy库中一些常用的统计学函数也可用于对数据框进行描述性统计。 实例: pandas提供了统计相关函数: pandas还提供了一个方法叫作d
阅读全文
摘要:pandas基础 pandas介绍 Python Data Analysis Library pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入 了大量库和一些标准的数据模型,提供了高效地操作大型结构化数据集所需的工具。 pandas核心数据结构 数据
阅读全文
摘要:排序 联合间接排序 联合间接排序支持为待排序列排序,若待排序列值相同,则利用参考序列作为参考继续排序。最终返回排序过后的有序索引序列。 案例:先按价格排序,再按销售量倒序排列。 复数数组排序 按照实部的升序排列,对于实部相同的元素,参考虚部的升序,直接返回排序后的结果数组。 插入排序 若有需求需要向
阅读全文
摘要:随机数模块(random) 生成服从特定统计规律的随机数序列。 二项分布(binomial) 二项分布就是重复n次独立事件的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,事件发生与否的概率在每一次独立试验中都保持不变。 二项分布可以用于求如下场景的概率的近似
阅读全文
摘要:什么是傅里叶变换? 法国科学家傅里叶提出,任何一条周期曲线,无论多么跳跃或不规则,都能表示成一组光滑正弦曲线叠加之和。 傅里叶变换的目的是可将时域(即时间域)上的信号转变为频域(即频率域)上的信号,随着域的不同,对同一个事物的了解角度也就随之改变,因此在时域中某些不好处理的地方,在频域就可以较为简单
阅读全文
摘要:有一个矩阵M,可以分解为3个矩阵U、S、V,使得U x S x V等于M。U与V都是正交矩阵(乘以自身的转置矩阵结果为单位矩阵)。那么S矩阵主对角线上的元素称为矩阵M的奇异值,其它元素均为0。 案例:读取图片的亮度矩阵,提取奇异值与两个正交矩阵,保留部分奇异值,重新生成新的亮度矩阵,绘制图片。
阅读全文
摘要:对于n阶方阵A,如果存在数a和非零n维列向量x,使得Ax=ax,则称a是矩阵A的一个特征值,x是矩阵A属于特征值a的特征向量 案例: 案例:读取图片的亮度矩阵,提取特征值与特征向量,保留部分特征值,重新生成新的亮度矩阵,绘制图片。
阅读全文
摘要:矩阵 矩阵是numpy.matrix类类型的对象,该类继承自numpy.ndarray,任何针对多维数组的操作,对矩阵同样有效,但是作为子类矩阵又结合其自身的特点,做了必要的扩充,比如:乘法计算、求逆等。 矩阵对象的创建 # 矩阵 import numpy as np #创建matrix对象(1)
阅读全文
摘要:矢量化 矢量化指的是用数组代替标量来操作数组里的每个元素。 numpy提供了vectorize函数,可以把处理标量的函数矢量化,返回的函数可以直接处理ndarray数组。 numpy还提供了frompyfunc函数,也可以完成与vectorize相同的功能 案例:定义一种买进卖出策略,通过历史数据判
阅读全文
摘要:符号数组 sign函数可以把样本数组的变成对应的符号数组,正数变为1,负数变为-1,0则变为0。 净额成交量(OBV) 成交量可以反映市场对某支股票的人气,而成交量是一只股票上涨的能量。一支股票的上涨往往需要较大的成交量。而下跌时则不然。 若相比上一天的收盘价上涨,则为正成交量;若相比上一天的收盘价
阅读全文
摘要:数组的裁剪 数组的压缩 数组的累乘 加法/乘法通用函数 案例 除法通用函数 案例: 三角函数通用函数 numpy.sin() 一个方波由如下参数的正弦波叠加而成: 曲线叠加的越多,越接近方波。所以可以设计一个函数,接收曲线的数量n作为参数,返回一个矢量函数,该函数可以接收x坐标数组,返回n个正弦波叠
阅读全文
摘要:数据平滑 数据的平滑处理通常包含有降噪、拟合等操作。降噪的功能意在去除额外的影响因素,拟合的目的意在数学模型化,可以通过更多的数学方法识别曲线特征。 案例:绘制两只股票收益率曲线。收益率 =(后一天收盘价-前一天收盘价) / 前一天收盘价 使用卷积完成数据降噪。 对处理过的股票收益率做多项式拟合。
阅读全文
摘要:多项式拟合 多项式的一般形式: y=p_{0}x^n + p_{1}x^{n-1} + p_{2}x^{n-2} + p_{3}x^{n-3} +...+p_{n} 多项式拟合的目的是为了找到一组p0-pn,使得拟合方程尽可能的与实际样本数据相符合。 假设拟合得到的多项式如下: f(x)=p_{0}
阅读全文
摘要:通过两组统计数据计算而得的协方差可以评估这两组统计数据的相似程度。 样本: 平均值: 离差(用样本中的每一个元素减去平均数,求得数据的误差程度): 协方差 协方差可以简单反映两组统计样本的相关性,值为正,则为正相关;值为负,则为负相关,绝对值越大相关性越强。 案例:计算两组数据的协方差,并绘图观察。
阅读全文
摘要:线性拟合 线性拟合可以寻求与一组散点走向趋势规律相适应的线型表达式方程。 有一组散点描述时间序列下的股价: 根据线型 y=kx + b 方程可得: 样本过多,每两组方程即可求得一组k与b的值。np.linalg.lstsq(a, b) 可以通过最小二乘法求出所有结果中拟合误差最小的k与b的值。 案例
阅读全文
摘要:什么是线性关系? 1 2 3 4 5 60 65 70 75 ? 线性预测 假设一组数据符合一种线型规律,那么就可以预测未来将会出现的数据。 根据线性模型的特点可以通过一组历史数据求出线性关系系数x, y, z,从而预测d、e、f下的一个数据是多少。 线性预测需要使用历史数据进行检验,让预测结果可信
阅读全文
摘要:布林带 布林带由三条线组成: 中轨:移动平均线 上轨:中轨+2x5日收盘价标准差 (顶部的压力) 下轨:中轨-2x5日收盘价标准差 (底部的支撑力) 布林带收窄代表稳定的趋势,布林带张开代表有较大的波动空间的趋势。 绘制5日均线的布林带
阅读全文
摘要:激励函数:g(t) 单位激励下的响应函数:f(t) 绘制时间(t)与痛感(h)的函数关系图。 5日移动均线序列可以直接使用卷积实现 使用卷积函数numpy.convolve(a, b, 卷积类型)实现5日均线 加权卷积 使用卷积函数numpy.convolve(a, b, 卷积类型)实现加权5日均线
阅读全文
摘要:收盘价5日均线:从第五天开始,每天计算最近五天的收盘价的平均值所构成的一条线。 移动均线算法: 在K线图中绘制5日.10日均线图
阅读全文
摘要:案例:统计每个周一、周二、...、周五的收盘价的平均值,并放入一个数组。 数组的轴向汇总 沿着数组中所指定的轴向,调用处理函数,并将每次调用的返回值重新组织成数组返回。
阅读全文
摘要:样本:S = [s1, s2, ..., sn] 平均值:m = (s1+s2+...+sn)/n 离差:D = [d1, d2, ..., dn], di = si-m 离差方:Q = [q1, q2, ..., qn], qi = di**2 总体方差:v = (q1+q2+...+qn)/n
阅读全文
摘要:将多个样本按照大小排序,取中间位置的元素。 若样本数量为奇数,中位数为最中间的元素 1 2000 3000 4000 10000000 若样本数量为偶数,中位数为最中间的两个元素的平均值 1 2000 3000 4000 5000 10000000 案例:分析中位数的算法,测试numpy提供的中位数
阅读全文
摘要:最值 np.max() np.min() np.ptp(): 返回一个数组中最大值/最小值/极差 np.argmax() np.argmin(): 返回一个数组中最大/最小元素的下标 np.maximum() np.minimum(): 将两个同维数组中对应元素中最大/最小元素构成一个新的数组 案例
阅读全文
摘要:算数平均值 S = [s1, s2, ..., sn] 样本中的每个值都是真值与误差的和。 算数平均值:m = (s1 + s2 + ... + sn) / n 算数平均值表示对真值的无偏估计。 np.mean(array)array.mean() 案例:计算收盘价的算术平均值。 加权平均值 样本:
阅读全文
摘要:绘制K线图 案例:使用matplotlib绘制K线图 绘制dates与收盘价的折线图: 绘制每一天的蜡烛图:
阅读全文
摘要:索引目录 1.基础/数组 2.绘图 3.加载文件 4.绘制K线图 5.算数平均值/加权平均值 6.最值 7.中位数 8.标准差 9.时间数据处理/数组的轴向汇总 10.移动均线 11.卷积 12.布林带 13.线性模型 14.线性拟合 15.协方差/相关矩阵/相关系数 16.多项式拟合 17.数据平
阅读全文
摘要:加载文件 numpy提供了函数用于加载逻辑上可被解释为二维数组的文本文件,格式如下: 调用numpy.loadtxt()函数可以直接读取该文件并且获取ndarray数组对象: 案例:读取aapl.csv文件,得到文件中的信息: 1.绘制dates与收盘价的折线图:
阅读全文
摘要:matplotlib概述 matplotlib是python的一个绘图库。使用它可以很方便的绘制出版质量级别的图形。 matplotlib基本功能 (一)基本绘图 (在二维平面坐标系中绘制连续的线) 1.设置线型、线宽和颜色 (1)绘画折线图,水平线/垂直线 (2)画一条正弦曲线,余弦曲线 2.设置
阅读全文

浙公网安备 33010602011771号