摘要: 4.1、多因子 4.1.1 假设检验与方差检验 假设检验适用于(数据样本较小时) 方差检验适用于(数据样本较大时) import numpy as np import scipy.stats as ss #生成一20个数的标准正态分布 norm_dist = ss.norm.rvs(size=20) 阅读全文
posted @ 2019-08-27 23:02 大脸猫12581 阅读(1701) 评论(0) 推荐(0) 编辑
摘要: 1、理论铺垫 Dataframe和Series均适用 ~集中趋势:均值mean()、中位数median()、与分位数quantile(q=0.25)、众数mode() ~离中趋势:标准差std()、方差var() import scipy.stats as ss 正态分布:ss.norm 、卡方分布 阅读全文
posted @ 2019-08-27 20:49 大脸猫12581 阅读(668) 评论(0) 推荐(0) 编辑
摘要: 数据学习网站:Kaggle 、天池、各个领域的统计数据(国家统计局……) https://www.jianshu.com/p/0fa4f84d48ee <!--StartFragment --> 世界卫生组织 : https://www.who.int/research/en/ Healthdata 阅读全文
posted @ 2019-08-27 20:41 大脸猫12581 阅读(158) 评论(0) 推荐(0) 编辑
摘要: a) 数据仓库(DW) 数据库 VS 仓库 数据库面向业务存储,仓库面向主题存储 数据库针对应用(OLTP),仓库针对分析(OLAP) 数据库组织规范,仓库可能有冗余,相对变化大,数据量大 b) 检测与抓取 c) 填写、埋点、日志 d) 计算 阅读全文
posted @ 2019-08-27 20:40 大脸猫12581 阅读(254) 评论(0) 推荐(0) 编辑