随笔分类 - python技术栈
python基础、数据分析、网络编程、金融分析等
摘要:1. tushare Tushare是一个免费、开源的python财经数据接口包。 http://tushare.org/index.html tushare pro版 https://tushare.pro/document/1 下载安装tushare接口包 get_k_data 获取k线数据 >
阅读全文
摘要:乘法 Numpy 中有三种常用的乘法:dot、matmul 和 multiply,对于新手来说很容易混淆三者的用法。 1. multiply: element-wise 乘法 这种乘法也叫 Hadamard product、Schur product,在数学上是指“两个矩阵的对应元素相乘”: \be
阅读全文
摘要:1. 动量策略 & 反转策略 计算股票池中所有股票在前一段时间的收益率 选择收益率最大(最小)的N只股票调仓 动量策略:如果某只股票在前一段时期表现较好,那么下一段时期该股票仍将有良好表现。反转策略:如果某只股票在前一段时期表现不好,那么下一段时期该股票将会反转,即表现变好。 import jqda
阅读全文
摘要:PEG策略 彼得.林奇:任何一家公司股票如果定价合理的话,市盈率就会与收益增长率相等。 市盈率 市盈率(PE)= 股价(P) / 每股收益(EPS) 市盈率 = 市值 / 净收益 例如:有一家包子铺,每年净利润为50万元,收购价格(市值)为100万元; 有一家家具店,每年净利润为100万元,收购价格
阅读全文
摘要:1. 均值回归理论 均值回归:“跌下去的迟早要涨上来” 均值回归的理论基于以下观测:价格的波动一般会以它的均线为中心,也就是说,当表的价格由于波动而偏离移动均线时,它将调整并重新归于均线。 定义偏离程度:(MA - P) / MA 均值回归策略: 在每个调仓日进行 计算股票池中所有股票的N日均线 计
阅读全文
摘要:因子选股策略 因子选股策略 因子:选择股票的某种标准 增长率、 市值、 市盈率、 ROE(净资产收益率) 选股策略: 对于某个因子,选取表现最好(因子最大或最小)的N支股票持仓 每隔一段时间调仓一次 小市值策略:选取股票池中市值最小的N只股票持仓 def initialize(context): s
阅读全文
摘要:第一个量化策略: 设置股票池为沪深300的所有成分股, 如果当前股价小于10元/股且当前不持仓, 则买入;如果当前股价比买入时上涨了25%, 则清仓止盈;如果当前股价比买入时下跌了10%, 则清仓止损。 https://www.joinquant.com/algorithm/index/list i
阅读全文
摘要:期货:风险高收益高;期货相当于现货(大件商品价格有个市场波动,比如20元买的,10元卖了叫炒现货,30元卖了也是炒现货;) 期货就是比如卖煤的基于当前市场价格10元/ T判断未来5个月会跌,买煤的基于当前市场价判断未来会涨,双方对未来的判断不同,签订期货合约。 黄金: 相当于股票价格比较稳定,需要保
阅读全文
摘要:XML与JSON的互相转化详见:XML模块 https://www.cnblogs.com/shengyang17/p/8606223.html event.xml <?xml version="1.0" encoding="utf-8" standalone="yes"?> <Events> <E
阅读全文
摘要:泰坦尼克号获救问题 数据来源:Kaggle数据集 → 共有1309名乘客数据,其中891是已知存活情况(train.csv),剩下418则是需要进行分析预测的(test.csv) 字段意义: PassengerId: 乘客编号 Survived :存活情况(存活:1 ; 死亡:0) Pclass : 客舱等级 Name : 乘客姓名...
阅读全文
摘要:社会财富分配问题模拟 一个财富分配游戏: 房间里有100个人,每人都有100元钱,他们在玩一个游戏。每轮游戏中,每个人都要拿出一元钱随机给另一个人,最后这100个人的财富分布是怎样的? 研究问题: 1、财富分配模型 模型假设: ① 每个人初始基金100元 ② 从18岁到65岁,每天玩一次,简化运算按照一共玩17000轮 ③ 每天拿出一元钱,并且随机分配给另一个人 ④ 当某人的财富值降...
阅读全文
摘要:婚恋配对实验 婚恋配对模拟规则: ① 按照一定规则生成了1万男性+1万女性样本: ** 在配对实验中,这2万个样本具有各自不同的个人属性(财富、内涵、外貌),每项属性都有一个得分 ** 财富值符合指数分布,内涵和颜值符合正态分布 ** 三项的平均值都为60分,标准差都为15分 ② 模拟实验。基于现实世界的提炼及适度简化,我们概括了三个最主流的择偶策略: ** 择偶策...
阅读全文
摘要:1.读取数据 以“豆瓣评分”为标准,看看电影评分分布,及烂片情况① 读取数据“moviedata.xlsx”② 查看“豆瓣评分”数据分布,绘制直方图、箱型图③ 判断“豆瓣评”数据是否符合正态分布④ 如果符合正态分布,这里以上四分位数(该样本中所有数值由小到大排列后第25%的数字)评分为“烂片标准”⑤
阅读全文
摘要:数据来源: 数据:全国2013-2016所有企业间的投融资信息数据 1、查看全国城际控股型投资关系 ① 通过“data.xlsx”导出csv后,直接通过gephi看全国投资情况,有什么发现?② 分别筛选出“同城投资”、“跨城投资”的TOP20,比较一下两类投资的数据分布** 按照2013-2016年
阅读全文
摘要:房价影响因素挖掘 房屋的租售比一般 200--300的区别比较合适 比如100平方米的房子,均价2万,总共200万; 假如贷款 3成,即600000万,按照6%左右的利率去算,贷款140万,期限30年; 用贷款计算器算下: 140万贷款30年,6.37%利率,本息合计3142656.29,每月还款8
阅读全文
摘要:然后把数据data.xlsx替换下 在百度地图拾取中心点坐标(以武汉为点),在settings.py里边设置下 http://loo2k.com/getpoint/ HTML页面展示 另存为start.shap 终点文件 >>> 跟上边一样,加载end.shap 使用LinePlotter插件 另存
阅读全文
摘要:双十一打折套路分析 1、从现有数据中,分析出“各个品牌都有多少商品参加了双十一活动?” 2、哪些商品真的在打折呢? 3、商家营销套路挖掘? 结论: 少量少打折:包括雅诗兰黛、娇兰、兰蔻、薇姿、玉兰油等共5个品牌。少量大打折:包括悦诗风吟、兰芝、欧珀莱等3个品牌。该类品牌的打折商品较少,但折扣力度较大
阅读全文
摘要:城市餐饮店铺选址的分析 基于这样一个数据 从 “口味”、“人均消费”、“性价比” 三个维度对不同菜系进行比较,并筛选出可开店铺的餐饮类型 添加Tool工具、十字标线 如下: import numpy as np import pandas as pd import matplotlib.pyplot
阅读全文
摘要:1.数据可视化 数据的表达逻辑: 它可能是数据可视化、图表的表现方式,通过数据本身的逻辑去对它学习,为什么用这个图表去表示这个内容?? 目的不在于分析过程,在于得到结果如何把它表达出来,是学习后面的这套逻辑。 数据可视化,以数据为工具,以可视化为手段,目的是描述真实,探索世界。为了表现内容,再是漂亮
阅读全文
摘要:0. SQL数据库 1. python基础知识 2. 重点工具掌握:数据解析核心技巧 - Numpy| Pandas| Matplotlib 3. 数据特征分析:分布| 对比| 统计| 帕累托| 正态| 相关性分析 4. 数据处理:缺失值| 异常值| 数据归一| 数据连续属性离散化 5. 数学建模:
阅读全文

浙公网安备 33010602011771号