裸考了一次雅思,我居然学会了数据分析!

大家好,这篇不是广告。最近发生了一件大事,前段时间我去考了一次雅思。

为什么要考雅思呢,主要原因是想申请一下新加坡国立大学的在职硕士,这样就可以一边工作一边混个文凭了。本来想的是来了这边开会什么的都会用到英语,日积月累之下应该能提升很多英语水平,然后稍微准备一下就可以通过了。而且申请标准应该也不会很高,据说6.0就够了,所以一直也没在意。

但是万万没有想到,平时的工作用到英语并不多,然后下班了之后不是写公众号就是玩游戏了,也没怎么准备。加上我也挺抗拒考英语这个事的,就一直拖一直拖,拖到了考前一天,真的是临时抱佛脚了。

雅思讲究四门功课,说学逗唱(大雾),听说读写。其中的听说读都没有任何办法临时突击,只有写作可以临时看下。因为据说写作当中有很多技巧,可以帮助我们提高分数。对我来说当然没有什么提高分数一说了,只希望不要太难看就行了。

我在B站上看了一支介绍雅思作文考试的视频,大开眼界。这哪里是英语作文讲解啊,简直是数据分析师入门指南。这件事也正是我本文的灵感来源,和大家分享一下这个有趣的发现。

图表作文

如果你考过雅思你就会知道,雅思的作为分成两个部分,第一个部分是看图说话,另一个部分就是我们常见的英文作文。在第一个部分当中,给我们的图不是漫画也不是说明某个故事,一般来说都是一张说明性的图表。比如说一张数据走势图或者是流程图,要求我们用英文来写一篇文章介绍图表当中的内容。比如这样:

面对这样一张图表我们需要用英语写150词的文章对图表当中的数据进行介绍和分析。根据雅思老师的说法,我们随意地写150个单词去介绍这张图表当中的信息是很难得到高分的, 因为这样图表数据分析和介绍的文章,词汇和表达只是一方面,逻辑和结构才是核心。接着,老师举了一个例子来讲解这样的作文应该怎么写。我听完之后陷入了深深的沉思,我最大的感想是这老师要是不去做数据分析师简直是可惜了。

这哪里是英语作文考试啊,明明是数据分析测试。

不管英语考试也好,数据分析也罢,我想说的是当我们面临这样一份数据的时候,我们应该从什么角度来思考和分析呢?

总体理解

我们拿到数据的第一件事就是从整体去分析,这是一份什么数据,它从宏观上展现出一个什么信息?

用上图来举个例子,从宏观上有哪些点可以抓呢?一个是标题,从标题当中我们知道了,这是加拿大的学生毕业数量数据。另外一个是坐标,横坐标从1992到2006,所以这说的是这14年间的数据。最后是图上的内容,也就是图中展示的两条线,一条线是男性另外一条是女性,所以这是一张反应两性毕业人数的图表。从这两条线的走势当中,我们会发现男女生毕业人数总体上都是在增加的。

如果你要写文章的话,你可能还需要注意一些用户和表达,但是如果做数据分析的话,我们总体上把握住这些信息就足够了。

这一点很多人会觉得这块太简单了,简直是废话,其实不然。我们在做数据分析的时候,经常会出现过于关注某些具体的值或者是原因而忽略了整体数据的一些情况。尤其是在我们和老板或者是其他同事分享某些数据的时候,更是如此。很多人做分享一上来直接就讲一些数据细节,无论是从逻辑上还是观感上都不是很好。在剖析细节之前,首先要做的就是先把大体的趋势把握住了,再去细扣细节,这样才能给人从大到小,游刃有余的感觉。

分析细节

研究完了总体,接下来要做的当然就是分析数据当中的细节。很多人很头疼这一块,他们会觉得图表已经把数据展示得很清楚了呀,我们还有什么好说的呢?难道就是单纯地罗列具体的数据吗?

当然不是这样的,你想想看当你向老板汇报的时候,你总不能说图表在这里,数据你自己看吧?我们肯定要能找到一些直观上看不到的点,这才是我们分析数据的能力。

那么,我们除了直接阐述具体的数据之外,还能做什么呢?其实还有两件事可以做,第一件是数据对比,第二件是寻找特殊值。我们分开一点一点来说。

数据对比

图表当中的数据一般都不是唯一的,比如上图当中有男性的数据也有女性的数据,既然有多份数据,那么我们就可以进行对比了。

很多人对数据对比的理解以为就是找不同,这份数据增长了,另外一份下跌了。其实不只是这样,我们用对比的方法来分析数据有三种方式,一种是找不同,可以看到每一年女性毕业生数量都远远高于男性,并且可以发现近几年女性数据的增长速度更快。第二种是找相同,这些数据之间有没有什么联系。比如说我们可以发现这两份数据的走势是非常近似的,两者陷入平缓以及快速增加的时间段都差不多,整个数据的走势是几乎完全一样的。

第三种很多人很容易忽略,既不是找相同也不是找不同,而是寻找数据之间的逻辑上的联系。比如说女性的数据增长的同时男性的数据也在增长,这两者是一个一起增长的关系,体现在数据分析上就是相关性。但是大数据时代,我们需要对数据尤其小心,有些相关性是真实的,有些可能是虚假的。举个例子,比如说我们如果分析喝咖啡和寿命之间的关系,会发现咖啡喝得越多的人平均寿命越长。这能说明是咖啡有益健康促进长寿吗?其实不然,可能只是因为喝咖啡的往往是上流社会,他们的生活条件、医疗条件更好而已。

寻找特殊值

这个技巧比较高级,即使是很多业内人士也未必知道。如果我们查看数据只看到是增长或者是下跌是远远不够的,还有很多细节藏在了一些特殊的点当中。比如说大家都知道拐点,在这个点之前是快速增长的,从这个点之后趋于平缓。

除了拐点之外,我们也可以找到很多其他类似的点。但光找到这些点是不够的,我们在分析数据的时候还需要进一步分析这些点背后的信息。比如我们看到从1995年开始毕业生人数开始了下降,那么这个下降的原因是什么?是因为总人口数下降了呢还是因为大学抬高了招生标准?或者是社会上流行起了反智主义大家不愿意读书了?再比如03年之后毕业生人数又开始了快速上升,这背后的原因又是什么?

我们分析原因并不是光猜测就完了,猜测之后还需要进行详细的考证。这个就和破案一样,我们有一个思路,需要进行严谨的分析和推理,还需要有证据。证据是什么?证据当然就是数据,没有比实实在在的数据更可以作为证据的了。也就是说我们先寻找特殊值,找到了之后,再对其特殊性进行原因分析。有了一些猜测之后,需要寻找或者是计算一份新的数据来作为依据来佐证我们的猜测。这样整个链路就打通了,说明你不只是看到了图上的数字,而且还理解了背后的原因。

能够做到这一点,是不是比单纯地阐述数据高明多了?如果你能这样和老板汇报,老板能不满意吗?

总结

从事这个行业,我遇见过很多人抱怨过分析数据枯燥无聊并且很难,不知道从何下手。其实和生活当中的绝大多数事情一样,这些都是有套路的。顺着先总后分,抓细节、做对比,挖掘特殊点、分析背后原因的逻辑,我们每个人都可以很轻松地交出一份不错的数据分析报告来。

当然,这一次的事情也给我了一个很大的启发。生活当中的很多事其实都不是绝对的,你看只要我们换个角度,雅思作文写作技巧也能变成数据分析入门教程。我想生活当中类似的事情肯定还有很多,希望我们都能有双慧眼,可以找到隐藏的价值。

今天的文章就到这里,衷心祝愿大家每天都有所收获。如果还喜欢今天的内容的话,请来一个三连支持吧~(点赞、关注、转发

更多精彩文章,请点个关注

posted @ 2020-12-17 10:14  Coder梁  阅读(1168)  评论(2编辑  收藏  举报