摘要: 常见分布 正态分布: 标准正态分布: 对数正态分布: 均匀分布: 指数分布: 伽玛分布:,其中 分布: 设是来自正态总体的一个样本,则 若是来自标准正态分布的一样样本,则其平方和服从自由度为n的分布。 贝塔分布: t分布:,t分布是正态总体的一个样本的样本均值与样本标准差的特定函数。当自由度较大(如)时,t分布可以用标准正态分布近似。 ... 阅读全文
posted @ 2016-03-25 20:53 SevnChen 阅读(5091) 评论(0) 推荐(0) 编辑
摘要: 大坑,努力把填上吧!果然是自己看明白是一回事,讲出来是另外一回事。 目录 一、语句说明 1 1、 PROC REG语句 1 1.1 数据集选项 1 1.2 输出和其他选项 1 2、 MODEL语句 2 2.1 模型选项 2 2.2 仅用于Rsquare、Adjrsq和CP模型选择方法的选项 2 2. 阅读全文
posted @ 2016-03-25 20:50 SevnChen 阅读(5782) 评论(0) 推荐(0) 编辑
摘要: 成为数据科学家只需要8步,看起来很简单的呢~~~ 阅读全文
posted @ 2016-03-25 20:41 SevnChen 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 非原创 看到一份关于麦肯锡逻辑思维的脑图,挺不错的,这里做了拆分。 目录 2.0、有逻辑,才有脑袋 2.1、工具1:金字塔原理 2.2、工具2:MECE原则 2.3、工具3:「So What?/Why So?」原则 2.4、工具4:事实基础+假设基调 2.5、工具5:逻辑树状图 2.6、工具6:七何 阅读全文
posted @ 2016-03-25 20:20 SevnChen 阅读(2549) 评论(0) 推荐(0) 编辑
摘要: 两张图,第一张为整体图,第二张为细节图。 若第二章不清楚,请右键新标签页中打开图片。 阅读全文
posted @ 2016-03-25 19:51 SevnChen 阅读(860) 评论(0) 推荐(0) 编辑
摘要: SQL快速入门(1) 基础知识 存储引擎 将MySQL中的数据存储在文件或者内存中的技术以及配套的相关功能在MySQL中被称为存储引擎。 使用SHOW ENGINES语句查询MySQL中支持的存储引擎; 主要存储引擎:InnoDB、MyISAM、MEMEORY三种存储引擎。 设置数据表的存储引擎:修 阅读全文
posted @ 2016-03-25 19:33 SevnChen 阅读(598) 评论(0) 推荐(0) 编辑
摘要: 【线性回归】线性回归模型中几个参数的解释 R方 决定系数/拟合优度 类似于一元线性回归,构造决定系数。称为y关于自变量的样本复相关系数。 其中,,有SST=SSR+SSE 总离差平方和记为SST,回归平方和记为SSR,残差平方和为SSE。 由公式可见,SSR是由回归方程确定的,即是可以用自变量x进行解释的波动,而SSE为x之外的未加控制的因素引起的波动。这样,总离差平方和SST中能够由方程... 阅读全文
posted @ 2015-12-22 10:59 SevnChen 阅读(37091) 评论(0) 推荐(0) 编辑
摘要: 异常点、高杠杆点、强影响点 异常点:残差很大的点;高杠杆点:远离样本空间中心的点;强影响点:改变拟合回归方程特征的点。注意: A点:非异常点、高杠杆点、非强影响点 A点在X空间中距离样本的中心较远,A是个高杠杆点; A点的位置在通过其他点的直线附近,残差很小,对拟合回归方程没有很大的影响,A点不是异... 阅读全文
posted @ 2015-12-06 22:36 SevnChen 阅读(17601) 评论(0) 推荐(1) 编辑