《程序是怎样跑起来的》第十二章
本章主要讲的是如何让计算机“学习”。想主要是使用Python编程语言。首先我们来说什么是机器学习,机器学习就是指让计算机这种机器来学习,在机器学习中,程序员只编写用于学习的程序,这个程序的内容是让计算机读取大量的数据,然后学习这些数据的特征并生成一个识别模型。C语言有多种不同的方法。首先我来介绍一下有监督学习,有监督学习就是,给计算机提供大量带正确答案的数据,以识别手写数字为例,我们可以给计算机提供大量手写数字的图片,并为每张图片配上它所代表的0到9中的确数字,这里的正确答案就充当了监督者的角色,有监督学习适用于手写数字识别这样的分类问题区域。
计算机学习中经常使用编程语言Python,因为Python中提供了包含各种机器学习相关功能的库。此外,Python是一种基于解释器的语言,这意味着我们可以用简短的程序来试验这些库的功能,Python运行程序的方法分为两种,一种是用Python显示器对事先编写好的源代码进行解释执行的脚本模式。另一种是直接启动Python解释器,通过键盘逐行输入程序并解释执行的交互模式。Python中可供程序使用的各种功能都以函数或对象的形式来提供,函数一般提供单一功能,对象一般提供复合功能,使用对象功能的语法是“对象名点.功能名”。Python标准的内置函数和对象是可以直接使用的,但机器学习中是用特殊函数和对象,需要通过import命令导入后使用。机器学习的步骤分为三步,第一步是将学习数据和答案数据划分为训练数据和测试数据。第二步用学习算法学习训练数据并生成模型。第三步用测试数据评估模型的性能。交互验证是一种不断轮换训练数据和测试数据来进行机器学习的方法,由此我们可以检验学习模型的识别率是否存在因学习数据的类型而出现偏差的情况。

浙公网安备 33010602011771号