实现人工智能是我们的目标,而机器学习是我们实现这个目标的方法,深度学习则是机器学习方法中的其中一种。我们希望机器可以有自主学习的能力,而不是只能在创造者提前设定好的规则下做出行为,这样的机器永远不能超过创作者。
机器学习框架
框架分为两部分;左边的就是学习过程,右边的 testing 就是使用训练好的模型做一些应用。

训练
function
在机器学习过程开始时,我们要准备好 function set,function set 就是我们的模型,这一集合中有大量的 function,function 就是我们针对目标场景想要赋予机器的能力。

goodness of function f
通过 training data,训练模型并通过 label 考察 function 的表现。
pick the "best" function
借助算法在 function set 中挑出表现最好的 function。
测试
挑出最好的 function 后,我们可以使用 training data 以外的新数据来考察 function 了。
机器学习相关技术

监督学习
线型模型
- regression 回归
Regression 是一种机器学习的 task,即指 machine 找到的 function,它的输出是一个 scalar,这就叫做 regression ;比如说判断一封邮件是否是垃圾邮件。 - classification 分类
在 Regression 中机器输出的是一个数值,在 Classification 里面机器输出的是类别。假设 Classification 问题分成两种,一种叫做二分类输出的是是或否(Yes or No);另一类叫做多分类(Multi-class),在Multi-class中是让机器做一个选择题,等于是给他数个选项,每个选项都是一个类别,让他从数个类别里选择正确的类别;比如判断一条新闻的类别。
非线性模型
在非线性的模型中最耳熟能详的就是 Deep learning,Deep learning 的 function 很复杂,因此它也可以做复杂的事情。除深度学习外非线性模型中还有 SVM,决策树等其他模型。
监督学习中的结构化学习
structured learning 中让机器输出要有结构性,举例来说:在语音辨识里面,机器输入是声音讯号,输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的object。或者是说在机器翻译里面你说一句话,你输入中文希望机器翻成英文,它的输出也是有结构性的。
半监督学习
上面提到的监督学习需要大量的training data,而训练数据的label则需要人工处理获得,而半监督学习可以大大减轻人力负担。
迁移学习
假设我们要做猫和狗的分类问题,我们只有少量的有label的data。但是我们现在有大量的data,这些大量的data中可能有label也可能没有label。但是他跟我们现在要考虑的问题是没有什么关系的,我们要分辨的是猫和狗的不同,但是这边有一大堆其他动物的图片还是动画图片,这些与问题无关的图片可以为我们带来什么帮助是迁移学习要做的事情。
无监督学习
更加进阶的就是无监督学习,我们希望机器可以学到无师自通。如果在完全没有任何label的情况下,到底机器可以学到什么样的事情。举例来说,如果我们给机器看大量的文章(在网络上收集文章很容易,网络上随便爬就可以)让机器看过大量的文章以后,它到底可以学到什么事情。
强化学习
在监督学习中,我们会通过带有label的training data来告诉模型待解决问题的答案是什么。而强化学习中,我们并不会告诉模型正确答案,我们只会为模型的表现评分。机器要在reinforcement learning的情况下学习,机器是非常intelligence的。reinforcement learning也是比较符合我们人类真正的学习的情景,你在学校里面的学习老师会告诉你答案,但在真实社会中没人回告诉你正确答案。你只知道你做得好还是做得不好,如果机器可以做到reinforcement learning,那确实是比较intelligence。
scenario, task and model
学习的场景(scenario)我们是没办法控制的,比如,因为我们没有data做监督学习,所以我们才做reinforcement learning。如果我今天可以监督学习,其实就不应该做reinforcement learning。在不同场景下我们会遇到不同的问题(task),可能会有regression、有classification、有structured。最后,在这些不同task里面有不同的model,在实际情况中要灵活应对。
浙公网安备 33010602011771号