《深入浅出数据分析》样章下载

序言

真难以相信,他们竟把这些东西写进讲数据分析的书里了。
本节回答一个热门问题:“作者为什么非要把这些东西写进一本讲数据分析的书里?”
谁适合阅读本书?
请先回答几个问题:
1. 你觉得,数据中隐含了无穷的智慧,只要有合适的工具,就能利用这些智慧,对吗?
2. 你想学习、理解和记忆如何创建靓丽的图形、试验假设条件、进行回归分析或整理混乱的数据,对吗?
3.你喜欢笑语喧哗的晚宴甚于枯燥、无聊的学术演讲,对吗?
如果以上问题全部回答“对!”——这本书适合你。
谁该和本书说拜拜?
请先回答几个问题:
1. 你是一个经验老道的数据分析师,正在调查数据分析领域最前沿的课题,对吗?
2. 你从未用过Microsoft Excel或OpenOffice calc,对吗?
3. 你惧怕尝试新事物,宁可上山打虎也不愿标新立异,对吗?你认为要是用拟人的手法叙述控制组和目标函数,技术书籍就难免有失严肃,对吗?
只要有一个问题回答“对!”——你与本书无缘。
[营销部捎话——只要有信用卡就可以买书哦。]
我们了解你在想什么
“这怎么能是一本严肃的数据分析书籍呢?”
“这些图都是用来干嘛的?”
“我真能这样学数据分析吗?”
我们了解你的大脑在想什么
.你的大脑渴望新事物。大脑总是不停地搜索、探查、等待不同寻常的事物,它天生如此,这正是你活力的来源。
那么,大脑怎么对待你所碰到的常规、普通、一般的事情呢?——它会竭尽全力阻止这些事情,以免干扰自己真正的工作——记录重要事项。大脑不会费力保存这些琐事;这些琐事从来不会成功地闯过“明显不重要事项” 关卡。
你的大脑如何知道哪件事重要?假想有一天你出门旅行,迎面扑来一只吊睛白额大虎,你的头脑和身体会有什么反应?
神经元发动……情绪激动……化学物质激增
于是,你的大脑知道——
这事绝对重要!记住!
但,想像你是呆在家里,或是呆在图书馆里,也就是说,是在一个安全、温暖、没有老虎的地方。
你正在复习迎考,要不然就是在努力搞懂一些艰深的技术,你的老板认为花个把星期就能搞定,顶多十天。
唯一的问题是:你的大脑想好好帮你一把,它试图保证不让这种“明显不重要”的内容去破坏珍惜的资源,这些珍稀的资源最好用来保存真正“重大”的事情,像老虎啊,像火灾险情啊,像你绝不该在大学生网站Facebook的网页上贴上那些“聚会”照片啊。没有什么便当的办法可以告诉大脑“喂,大脑,我对你感激之至,可惜啊,不管这本书多无聊,也不管我的情感地动仪如何纹丝不动,我真的希望你把这些材料都记住。”
你的大脑觉得这很重要。
你的大脑觉得这不值一提。
行啊。才不过488页而已,这些枯燥、无聊、烦人的内容。
我们认为该系列图书的读者都是学习者。
既然要学习,怎样才能学会呢?首先,你得搞懂,然后,切勿遗忘;一字一句硬塞不是办法。根据最新的认知科学、神经生物学及教育心理学研究结果,学习远不仅仅是读书认字。Head First知道怎么让你的脑筋动起来。
下面是部分深入浅出(Head First)教学原则:
将知识图形化。图形比单调的文字好记得多,可以提高学习效率(记忆学习和转移学习的学习效率最多能提高89%);图形还能让知识更容易理解,相比将文字放在页脚和下一页,将文字放在相关图形当中或图形周围,学习者成功解决相关问题的可能性将成倍增长。
采用对话式的个性化风格。最近的研究表明,要是回避一本正经的语气,代之以对话般的风格,以第一人称平易近人地给学生上课,学生的课后测验成绩最多可提高40%。多讲几个故事,少来一点高谈阔论,语气宜随和。
别太郑重其事。想想看,一局笑语喧哗的晚宴,或是一场演讲,哪一样更让你惦记?
引导读者深入思考:换句话说,除非读者主动调动自己的神经元,否则脑袋里不会发生什么大变化。只有激发读者的兴趣,引起读者的好奇,刺激读者的灵感,读者才能解决问题,得出结论,获得新知识。为此,讲授者要设计各种难题、练习,提出引人深思的提问,还要多让读者做一些让左右脑半球和多种感官都动起来的活动。
牢牢吸引读者的注意力。大家都有这样的体验——“我是真想学,但看完第一页就晕了”。大脑注意的是不同寻常的、有趣的、奇怪的、引人注意的、出人意料的事情。学习一种新颖艰深的技术不一定非得枯燥乏味不可,果真有此幸运的话,大脑会学得更快。
影响读者的情感. 现已知道,人的记忆能力在很大程度上取决于要记忆的内容对情感的影响。我们关心什么,就会记住什么;我们对什么事有感觉,就会记住什么。这里讲的情感并非天灾人祸给人带来的撕心裂肺的伤痛情感,而是惊讶、好奇、感觉有趣、想追根究底之类的情感,以及在猜对一个字谜、在学会别人感觉难以学会的事情或是在意识到自己懂的东西居然比工程部那位开口闭口“我比你有技术”的张三还多时,油然而生的“我是老大”的感觉。
元认知:对思考的思考
如果真想学东西,而且想学得更快更深入,就要关注自己如何集中注意力。要思考自己的思考方式;研究自己的研究方式。
大多数人在成长过程中都不曾学习元认知和学习理论方面的知识。人们期望我们学知识,但极少有人教我们如何学。
但想像得到,捧着本书的你,的确想学习数据分析知识,同时可能不想花费太多时间。要想利用在本书中读到的知识,就得记住读过的知识,为此必须理解这些知识。为了淋漓尽致地发挥本书或任何书本或学习经验的作用,请管好你的大脑,请管好大脑对待本书的态度。
诀窍在于让大脑把正在学习的新资料当做“正经大事”——对幸福至关重要的大事,像老虎一样重要的大事。若非如此,你就会陷入一场持久战:你竭力要记住新知识,大脑却竭力要把这些新知识踢出去。
既然如此,如何让大脑像对待吃人的老虎一样对待数据分析知识呢?
有两种办法,一种缓慢而乏味,一种迅速而有效。慢办法是简单记忆。你显然明白,只要不停地把同样的东西往大脑里灌,即使是最乏味的知识,也能学会、记牢。只要重复灌的次数足够多,大脑就会想:“这些东西给他的感觉并不重要,但他不停地看这些相同的东西,一遍,一遍,再一遍。因此我猜这些东西肯定很重要。”
快办法是做一切增进大脑活动的事,尤其是不同类型的大脑活动。上一页讲了很多这样的活动,事实证明,这些活动全都能促使大脑以有利于己的方式工作。例如,研究表明,将文字放在文字所描述的图片当中(相反的做法是将文字放在页面中的其他位置,如注释位置或正文位置),会促使大脑努力想搞清楚文字和图片之间的关系,进而发动更多神经元。
更多神经元发动 = 更有机会让大脑明白某件事值得注意,可能还值得记住。
对话式的写作风格对此很有帮助。人们在与人对话时注意力会更集中,原因是别人期待他们有所表现。令人惊讶的是,大脑不一定会在意“对话”是在人和书之间进行!反之,要是写作风格了无新意,乏味枯燥,大脑的感觉就和在挤满消极听众的屋子里听演讲没什么两样:没必要保持清醒。不过,图形和对话式风格只是起步……
我们的做法:
我们使用丰富的图片,这是因为,大脑追逐图像,而非文字。在大脑的活动中,一张图片胜过千言万语。 当同时使用图片和文字进行说明时,我们将文字填写在图片当中,当文字出现在它所描述的事物当中时,大脑的工作更有效率;相反,若将说明性文字放在注释或其它正文当中,则无此效果。
我们使用反复论述法,即以不同的方式、通过不同的媒介对同一主题进行反复描述,给读者营造丰富的感受,目的是让这些主题有更多机会印在大脑的多个区域。
我们以出人意料的方式叙述概念和使用图片,因为,大脑追逐新鲜事物;我们在图片和创意中或多或少加入了一些情感性的内容,因为,大脑关注情感的生物化学反应。让人有所感触的东西更可能让人记住,即使这点感触不过是一丝幽默、一丝惊讶或一丝兴趣,也是如此。
我们使用个性化的对话式写作风格,因为,当大脑认为你是在进行对话而不是在消极地听报告时,就会调整到注意力更集中的状态。即使在读书时,大脑也是这个习惯。
我们安排了80多个活动,因为,相比读书,在做事时,大脑经过调整,能学会和记住更多东西。我们安排的练习有难度,但不会让人束手无策,这正是大多数人愿意做的练习。
我们使用多种教学风格,因为,有的人可能喜欢一步一步按顺序来,有的人可能喜欢先看懂大图,还有一些人可能只想看看例子。我们将以多种方式反复讲述相同的主题,不管读者的个人爱好如何,都将因此受益匪浅。
我们安排了让左右脑半球分别负责的内容,因为,大脑开动部位越多,就学得越多,记得越多,注意力更持久。由于一侧大脑工作往往意味着另一侧大脑得到休息,左右半脑的分工合作使得长时间学习的学习效率得到提高。
我们还安排了一些场景和练习,在场景中展现不同的观点,因为,当大脑被迫进行评估和判断时,会调整到深入学习状态。
我们在练习中安排了一些难点,即提出一些无法简单回答的问题。因为,你的大脑在不得不处理某件事情时,会调整到学习和记忆状态。开动脑筋吧,“光看别人做运动无法让自己体态健美”。别担心,我们尽力保证,你努力学习的都是该学的,你不会为了对付一个费解的例子或为了分析一段用词过于晦涩或行文过于简练的段落而多用一个脑细胞。
我们以人物为例,把人物安排在场景、实例、图片等等内容中。至于原因嘛,因为你是人群中的一员啊,你的大脑对人比对事更关注。
你的任务:征服大脑
我们的工作到此为止,剩下的就看你的了。从下面这些提示出发,顺从大脑的判断,看看哪些对你有用,哪些对你没用,尝试一下新事物吧。
把这张图剪下来,贴在冰箱上。
慢慢读。理解的内容越多,要记忆的内容越少。
忌死读。停一停,想一想,碰到书中的提问时,别直接翻看答案;想像真的有人在问你这个问题。强迫自己的大脑想得越深,学会、记住的概率就越大。
自己做练习,自己记笔记。
我们安排了练习和笔记,但是,要是我们替你完成,就像让别人替你锻炼身体一样;只动眼不动手也不可取,要动动笔。大量证据证明,学习时的身体动作能提高学习效率。
阅读“世上没有傻问题”部分
世上没有傻问题。这些问题并非可看可不看,这是核心内容的组成部分!请勿忽略。
请将下面这段话作为最后一段床头阅读文字,或起码作为最后一段高深的床头阅读文字。
有一部分学习过程(尤其是短暂记忆转变为长期记忆的过程)发生在放下书本之后,大脑需要有自己的时间进行更多处理。如果在这段处理时间内学新东西,将会丢失一些刚学会的东西。
开口大声讨论。
说话会刺激大脑的其它部分。如果你正在努力理解一些知识,或正在努力增加以后记住这些知识的概率,请大声说出这些知识。还有一种更好的做法,试着向别人大声解释这些知识。你会学得更快,可能还会发现一些阅读时不曾发现的名堂。
大量喝水。
充沛的体液会让大脑处于最佳工作状态,脱水(早在感到口渴前就会发生)则会让认知功能下降。
聆听大脑的声音。
留意你的大脑是否超负荷工作。若你发现自己开始心不在焉,或是刚刚读过的东西转眼忘记,就该休息。一旦过了某个学习点,哪怕拼命塞,也无法提高学习效率,反而有可能影响学习过程。
找到感觉。
大脑需要知道事情是否重要。让自己融入各种场景,为照片设想旁注,就连抱怨一个并不好笑的玩笑,也比什么感觉都没有强。
勤加练习!
学会数据分析的唯一办法就是勤加练习,这正是本书的要求。数据分析是一门技术,精于此道的唯一办法就是大量实践。本书将给你带来大量实践机会:每一章中都有一个等待你解决的问题,千万别跳过这些问题不看——大量学习都发生在解决问题的过程中。我们为每一个问题提供了答案,要是卡了壳(有些细微之处很容易给人带来麻烦),别不敢看!不过,请尽量先解决问题再看答案,务必让你的办法行之有效,然后才继续看书中的下一部分内容。
自述
本书是经验之谈,并非参考书籍,我们故意抽掉了会妨碍讲述书中相关知识的东西。本书对你已经见识过和学习过的知识作了一些假设,因此第一次通读本书的时候,需要从头读起。
本书并非软件工具指导书。
许多以“数据分析”为题的书籍都是顺着Excel函数表把认为和数据分析有关的部分一路讲下去,然后针对每个函数给几个实例。但《深入浅出数据分析》讲的是如何成为数据分析师,尽管你在本书中会学到相当多的软件工具,但它们不过是手段而已,目的是学习如何进行出色的数据分析。
我们希望你懂得如何使用基本的电子表格公式。
用过电子表格的“SUM”求和公式吗?要是没用过的话,你可能先要突击一下才能开始学习本书。尽管许多章节根本不要求使用电子表格,但其它有此要求的章节却假定你会使用各种公式。要是熟悉“SUM”工具,那么你基础不错。
本书超越统计学。
本书充满统计知识,作为数据分析师,你应该尽量多掌握一些统计知识,读完《深入浅出数据分析》之后,最好再读一读《深入浅出统计学》(Head First Statistics)。不过,“数据分析”不仅涵盖统计学,还牵涉到许多其它领域,本书中选用的非统计题材主要用于讲解来源于现实生活的具体、实用的数据分析经验。
活动并非可做可不做。
练习和活动不是“点缀”,而是本书的核心组成部分。这些练习和活动有的是为了帮助记忆,有的是为了帮助加深理解,还有的是为了帮助应用所学知识,切勿忽略。唯一的例外是填字游戏,这不是非做不可,不过,填字游戏会让大脑得到在不一样的语境下思考所学到的单词和术语的大好机会。
反复论述是刻意而重要的安排
深入浅出系列书籍有一个明显特色:我们希望你“真正”掌握学到的知识,我们希望你在看完本书的同时就记住学到的知识。大多数参考书都不把记忆和回忆当做一个目标,但本书的目标是“学会”,所以,常常会看到同一概念多次出现。
本书意犹未尽。
我们乐于看到你在书籍合作网站上找到更多实用而有趣的资料,下列网站可为你提供这些资料:
http://www.headfirstlabs.com/books/hfda/.
“动动脑”练习没有答案
有一些“动动脑”练习没有标准答案;另有一些练习可以参考“动动脑”活动的学习经验部分判断自己的答案是否正确以及在什么情况下会正确。部分“动动脑”练习给出了提示,为你指明正确方向。

 

样章下载链接:http://download.csdn.net/source/2767413

posted @ 2010-10-19 13:45  博文视点  阅读(1265)  评论(0编辑  收藏  举报