吴恩达-机器学习笔记-第一章引言(Introduction)

参考:机器学习

笔记:

1.2机器学习是什么?

  1. 即使是在机器学习的专业人士中,也不存在一个被广泛认可的定义来准确定义机器学习是什么或不是什么

  2. 有几个定义,年代近一点的定义,由 Tom Mitchell 提出,来自卡内基梅隆大学,Tom 定义的机器学习是,一个好的学习问题定义如下,他说,一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值 P,当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。作者认为经验 E 就是程序上万次的自我练习的经验而任务 T 就是下棋。性能度量值 P 呢,就是它在与一 些新的对手比赛时,赢得比赛的概率。
  3. 目前存在几种不同类型的学习算法,主要的两种类型被我们称之为监督学习和无监督学习。监督学习这个想法是指,我们将教计算机如何去完成任务, 而在无监督学习中,我们打算让它自己进行学习。

 

1.3 监督学习

  1. 监督学习指的就是我们给学习算法一个数据集。这个数据集由“正确答案”组成。监督学习包含两类问题:回归问题和分类问题。
  2. 回归问题:在房价的例子中,给了一系列房子的数据,给定数据集中每个样本的正确价格, 即它们实际的售价然后运用学习算法,算出更多的正确答案。回归这个词的意思:试着推测出一个连续值的结果
  3. 分类指的是,我们试着推测出离散的输出值:0 或 1 良性或恶性,而事实上在分类问题 中,输出可能不止两个值。
  4. 在其它一些机器学习问题中,可能会遇到不止一种特征。某些算法不仅能处理 2 种 3 种或 5 种特征,即使有无限多种特征都可以处理。怎么处理无限多个特征,甚至怎么存储这些特征都存在问题,你电脑的内存肯定不够用。我们以后会讲一个算法,叫支持向量机,里面有一个巧妙的数学技巧,能让计算机处理无限多个特征。(什么技巧)
  5. 监督学习:其基本思想是,我们数据集中的每个样本都有相应的“正确答案”。再根据这些样本作出预测,就像房子和肿瘤的例子中做的那样。 我们还介绍了回归问题,即通过回归来推出一个连续的输出,之后我们介绍了分类问题,其 目标是推出一组离散的结果。

 

1.4 无监督学习

  1. 不同于监督学习的数据的样子, 即无监督学习中没有任何的标签或者是有相同的标签或者就是没标签。所以我们已知数据集,却不知如何处理,也未告知每个数据点是什么,别的都不知道,就是一个数据集。没有提前告知算法一些信息,比如,这是第一类的人,那些是第二类的人,还有第三类,等等。你能从数据中找到某种结构吗?针对数据集,无监督学习就能判断出数据有两个不同的聚集簇。 这是一个,那是另一个,二者不同。是的,无监督学习算法可能会把这些数据分成两个不同的簇。所以叫做聚类算法。
  2. 新闻事件分类的例子,就是那个谷歌新闻的例子,我们在本视频中有见到了,我们看到, 可以用一个聚类算法来聚类这些文章到一起,所以是无监督学习。
posted @ 2021-10-16 14:36  旷野之息  阅读(81)  评论(0)    收藏  举报