随笔分类 -  深入浅出数据分析

摘要:一 误差 1. 预测有失精准并不稀奇。需要在进行预测时指出误差范围,就能知道平均预测值,还能知道该误差造成的典型偏差。指出误差可以让预测和信念更全面。 2. 回归方程预测的是平均结果,用回归方程预测数据范围之外的数字成为外插法。外插法与内插法不同,内插法对数据范围内的点进行预测这正是回归法的本来... 阅读全文
posted @ 2015-06-03 22:33 amberblue 阅读(476) 评论(0) 推荐(0)
摘要:一 洞悉一切,为仆先知 回归分析法力无边,只要使用得当,就可预测某些结果值。若与控制实验同时使用回归分析还能预测未来。二 针对数据进行预测 1. 使用散点图:一种从多方面展现数据特点的快捷办法,只要数据涉及两种变量(两种变量成对出现并描述了数据中隐含的人或事就可同时放在散点图中),就该考虑使用散点... 阅读全文
posted @ 2015-06-03 21:19 amberblue 阅读(191) 评论(0) 推荐(0)
摘要:一 汇总数据 数据太多则很难一口气看完、看懂,除非先进行汇总,否则无法彻底领悟数据的意义。 先从数据分解成基本数据块着手,有了这些数据块,就能观察平均值或其他有用的汇总统计值。二 用Excel制作直方图 工具/加载宏/分析工具库---便将数据分析加载到工具中。 直方图的X轴一般表示某种数据的... 阅读全文
posted @ 2015-06-02 20:05 amberblue 阅读(170) 评论(0) 推荐(0)
摘要:变量之间可以正相关,也可以负相关 观察数据变量的好办法,即搞清楚这些变量是正相关还是负相关。若以中国变量增大意味着另一种变量也增大,则为正相关;若一种变量增大意味着另一种变量减少,则为负相关。可以将正负相关的变量关系编织成一个模型。 各种变量之间是相互影响的,一种变量发生改变则与之相关的其他变量... 阅读全文
posted @ 2015-05-28 21:53 amberblue 阅读(531) 评论(0) 推荐(0)
摘要:对庞大数据的筛选 庞大的数据容易让人发狂,如果手上的数据庞杂,而且对于如何处理这些数据没有把握,这是只要记住分析目标就行:记住目标,目光停留在和目标有关的数据上,无视其他。数据图像化的根本在于正确比较 为了形成优秀的图形,首先要明确能够实现客户目标的基本比较对象使用散点图探索原因 散点图是探索... 阅读全文
posted @ 2015-05-27 22:54 amberblue 阅读(541) 评论(0) 推荐(0)
摘要:一 什么是最优化问题 当希望尽量获得最多(或做少)的某种东西,而为了是实现这个目的需要改变其他一些量的数字,这就是一个最优化的问题。二 解决方式 为了解决一个最优化问题,需要将决策变量、约束条件及希望最大化的目标合并成一个目标函数。且任何最优化问题都有一些约束条件和一个目标函数 P=c1*x1... 阅读全文
posted @ 2015-05-26 20:08 amberblue 阅读(2867) 评论(0) 推荐(0)