初学者学习机器学习应该选择哪本教材?

初学者学习机器学习应该选择哪本教材?

来吧,做一个时代的弄潮儿……卷进来吧……

据我观察,现在很多想转行从事机器学习的,其实都不是因为真的喜欢,而是因为这个方向挣钱多。但是话说回来,我也喜欢赚钱多的机会……

这几年其实火起来的人工智能技术,说到细的地方其实是深度学习,deep learning,虽然这几年这个方向发展的很迅速,很强大,很烧钱,也很赚钱,但是必须要说的是,媒体上天天吹嘘的,人工智能是因为有智能这个词,容易有科技感,而说到底是深度学习这个方向,或者说神经网络往前走了走,再或者说是机器学习的一个方向往前走了走。甚至可以说,是曾经在2012年前很难找工作的计算机视觉(computer vision或者machine vision)现在有了应用市场了,春天来了。当然必须要提的是,深度学习并不是只有计算机视觉方向发展了,在语音方向也有发展,只是在CV方向,原来是难就业,现在是一片汪洋全是做CV的。

教材著作也出来好多好多,国外经典的就是花书 deep learning,作者是Ian Goodfellow and Yoshua Bengio and Aaron Courville。有中文版,翻译的怎么样,反正据说还可以。当然,你如果英文好,看原本是不二选择。但是对作者这三位大牛,如果你一个都不知道,那你先不用管这本书了,说明你对这个行业了解的太少太少,先从基本开始吧,直接跳过本段接下来的内容往下看吧。花书这本书是书如其名,专门针对深度学习的,如果想针对这个方向深入,基础又够,其实看这本挺好的,推荐英文版。

 

 

花书

 

 

西瓜书

如果你对机器学习、统计学习、模式识别,这些词都不太懂,那么我建议你从西瓜书开始,西瓜书是其俗称,因为该教材中所有例子都是来自于炎热夏天怎么挑西瓜,封面也是可口的西瓜,所以俗称西瓜书。其真名是《机器学习》,南京大学周志华教授的著作,作者不用多介绍,是国内少有的没有出国镀金的机器学习领域的领军人物之一。以前还有自动化所王珏教授,机器学习大牛之一,也培养了好多优秀学生,遗憾王教授前几年去世了。西瓜书相对来说,比较全面,再者难易度比较广,开始看的时候有些难的地方看不懂没事,先尽量走一遍,对机器学习中的分类、决策树、集成学习、神经网络、聚类、特征提取等等都有大概认识了,再细看,难点不懂得的好好琢磨或者查资料。在看这本书的过程中,第一遍先从推导公式开始吧,这也是这本教材不太友好的一个地方,公式推荐太粗略了,因此市面上有小伙伴已经出版了公式推导的辅导教材了,大家可以去书店翻翻,名字是《机器学习公式详解》,该书长相如图所示。该书很薄,里面有些公式可以作为参考,第一遍可以不看书推导西瓜书的公式,推不出来再看别的书或者网上搜。

 

 

当然如果你已经到了可以独自这个推导公式阶段,我觉得你可以尝试用另外一本书作为参考书,那就是大名鼎鼎的《统计学习方法》,这套书是李航研究员的著作,第一版就广受好评,但是其实不太适合小白。我自己觉得适合对机器学习大概有一定实践和认识的人,想把理论知识系统串一下或者提升一下的,研究生或者对课程掌握要求较高的本科生,这本书知识点总结的实在是太好了,公式其实补充的也很好,但是就是因为是知识点串起来的,很成体系,又不厚,这样就有个问题,比较抽象,书里有很多知识点是放在例题里进行讲解的,而不是像大多数教材那样,讲完知识点再用例题来巩固,这本书好多地方是例题的形式来介绍知识点,当然例题也不算太多,所以很抽象。但是这本书在我心目中,知识点讲解的比西瓜书清晰,大概是因为例题这些东西不需要多,只需要精即可,再者我多少也有一定实践经验了,对西瓜书里的很多例题不是很喜欢,西瓜书的例题实在是感觉有点啰嗦(逃……)。

 

 

如果对西瓜书和统计学习方法都看过,大概就懂得了机器学习本质上就是在数据的基础上进行优化,而优化的对象就是目标函数,是优化理论的知识(从数学上来说,机器学习就是做最优化的)。但是作为一名实用主义者,机器学习就是用有限的数据去描述一个现象,希望能找到最佳描述参数,这组参数能描述手里看到的数据也能描述未来新数据。深度学习就是机器学习中,神经网络的发展壮大,而深度学习中用到的很多单元,都是机器学习别的方法用到的,所以你可以说要想懂深度学习,要先了解机器学习。

在看书的过程中,最好结合例题进行学习。我推荐统计学习方法和西瓜书的习题,西瓜书的习题比较好找,大家可以参考网上的资料,但是有些资料并不是唯一的,或者准确性打个问号,这也是好事,本来西瓜书的例题数据量都少,其实用哪种方法来解决都可以,效果也没差多少。

我不建议大家第一次学就先去调用网上的各种第三方库,所以就先不推荐了。

 

发现公众号可以直接从文档导入,所以很多东西会在公众号备忘。

 

posted @ 2022-02-03 17:09  caoeryingzi  阅读(534)  评论(0编辑  收藏  举报