初识机器学习

初识机器学习

机器学习的两个定义:

  1. 一个计算机不需要明确的程序就能自己学习的能力。
  2. 一种用于完成任务T,用P来衡量表现和性能并且利用完成任务的经历E去改进自己的程序。

Supervised Learning(监督学习)

监督学习分为两种:regression(回归)和classification(分类)

  1. regression:回归算法
    • 回归算法式通过输入一个全是正确答案的值,进行回归拟合之后,尝试去预测得到一组连续的输出。
    • 通常来说,集合中的值是离散的,而预测的值是连续的。
    • 也就是说,我们得到了全是正确答案的集合后,试图找到一个几乎完全贴近的函数,并用该函数式预测正确答案集合中没有给出的数据。
  2. classification:分类算法
    • 分类算法是将特征值和种类判别结果输入后,尝试去预测别的特征值下的种类判别结果。
    • 就是根据特征值情况先进行划分,再去预测数据,来判断这个数据属于猫还是狗。
    • 且通常情况下特征值不止一个,有可能是无限个,我们希望通过算法,将特征值输入后,能够对数据进行分类。

Unsupervised Learning(非监督学习)

  • 它和监督学习最大的区别就是,算法的输入数据没有所谓的对错和正负。
  • 非监督学习的主要功能是,让算法自己去发掘数据之间的结构,将结构相同的数据分别集合成一团。
  • 这好像和分类算法有点像。但是由于非监督学习接收到的数据是没有所谓特征值的,他必须自己去找到数据之间的结构,再加以分类。

学习和开发的建议

课程中,讲师建议,先用类似matlab或者octave之类的工具对算法模型进行构建,再到Java或者C++进行具体的实现。这样对学习和开发都能大大地提高效率。

posted @ 2020-03-20 20:42  Herman·H  阅读(246)  评论(0编辑  收藏  举报