菜鸟根据周志华老师pdf所写,盗了点图望谅解

错了请联系我更正

1.什么是机器学习?

机器学习是从人工智能中产生的一个重要的学科分支,是实现智能化的关键

 

2。机器学习的用途?

example:修复文物(通过分类模型,对文物进行识别拼接),帮助奥巴马竞选(通过进行预测,进而判断出那个洲的人更容易税负他们倒戈,和理由)。。。

3.大数据时代,机器学习的总用

4。机器学习基本用语

监督学习:从给定的训练数据集中学习出一个函数(模型参数),当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入输出,也可以说是特征和目标。ps:相当于给出了 x与y,通过输入输出,不断训练得到一个最优模型(这个模型属于某个函数的集合,最优表示某个评价准则下是最佳的)。金典无监督学习算法 knn,

无监督学习:对没有概念标记(分类)的训练样本进行学习,以发现训练样本集中的结构性知识。这里,所有的标记(分类)是未知的。因此,训练样本的岐义性高。聚类就是典型的无监督学习 ps:不是告诉机器去把我们的样本去分类,而是 尽最大可能把具有相同特征的聚集在一起。

数据集:一组记录的合集

示例:对于一哥对象的描述

属性:对象某方面的特征 ps:西瓜的有无籽粒

特征:属性

属性空间:属性张成的空间

样本空间:

输入空间:

学习算法:从训练中得到最优算法

模型:泛指从数据中学到的结果

真相:潜在规律自身

学习器:模型的另一种叫法,把学习算法在给定数据和参数空间的实例化

泛化能力:学得模型适用于新样本的能力。一般来说,训练样本越大,越有可能通过学习来获得具有强泛化能力的模型。

奥卡姆剃刀原理:如无必要,勿增实体

NFL定理:总误差与算法无关,在脱离实际意义情况下,空乏的谈论哪种算法毫无意义。ps:具体问题具体分析,在问题中算法A相比B,有可能适合前一段,而后一段有可能相反