机器学习笔记一
1、什么是机器学习?
机器学习(Machine Learning,ML)是人工智能的子领域,也是人工智能的核心。它囊括了几乎所有对世界影响最大的方法(包括深度学习)。机器学习理论主要是设计和分析一些让计算机可以自动学习的算法。
我的理解是计算机通过大量的数据进行分析得出一定的规律,当规律越贴近现实情况,它的性能就越高。
2、机器学习算法种类?
监督学习(supervised learning)的数据集拥有既定的标签,即训练的数据集已经有了某种特定的属性。
非监督学习(unsupervised learning)的数据集没有任何既定标签,完全让算法去分析这些数据,找出一些特殊情况,大多聚类算法都是非监督学习。
半监督学习(semi-supervised learning),虽然数据集有既定标签,但是有时候有些数据会有缺失。
强化学习(reinforcement learning)即根据当下的环境不断的去学习,不断的发现数据,不断训练自己。
3、机器学习主要问题?
监督学习主要分为两个任务:分类和回归
例如预估房价就属于回归问题,而良性/恶性肿瘤的判断就属于分类。两个的主要区别在于输出的值是连续的还是离散的。对于房价来说,价格是一个连续的值,而对于良性/恶性肿瘤来说只有两种类别,可以看成0/1,是一个离散的值。因此回归和分类可以通过对输出值的改变来相互转化。例如预估房价转换为预估房价判断是否值得购买,从而转换为分类问题。良性/恶性肿瘤转换为预测肿瘤类别,从而转换为回归问题。

浙公网安备 33010602011771号