李宏毅机器学习(一) 机器学习介绍
对于一项任务,在制定机器学习策略之前,通常会采用人工手工总结规则来应对(可抽象为制定成千上万个if-else),程序根据制定的规则来处理任务,这成千上万个if-else我称为表达空间。
-
手工总结规则的问题:
- 表达能力不足:人工总结的规则,表达空间有限,不能包含所有的情况,基于手工规则的机器,只能处理规则以内的事物。
- 成本高:一项复杂的任务需要制定大量的规则任务,这需要富有经验的多个领域专家参与,需要大量时间和金钱。
-
机器学习所做的,可以想象为帮我们找到一个可以表达该项任务的函数,具体可分为三步:
- 设定模型集合:也就是一个可用于该任务的模型,可以理解为一个公式,也可以理解为神经网络模型,由于参数的不同,所以可以构成多个不同的模型,所以称为模型集合。
- 判断函数对于该项任务的好坏:也就是判断上述的模型运用于任务的效果好坏。
- 找出最优的那个模型:根据2步结果,找出最优的那个模型(效果最好,损失最小,误差最小等)

-
机器学习相关的技术
- 监督学习:有带标签的学习资料(一张图,一段描述图片的话)
- 回归:模型输出的是数值,例如预测温度。
- 分类:模型输出的是类别,例如🐱,🐕,🐒
- 二分类:输出是否,例如是猫,不是猫。
- 多分类:输出对应类别,例如🐱、🐕 或 other
- 半监督学习:训练使用的数据,一部分不带标签,利用不带标签的数据也能帮助模型学习。
- 迁移学习:将一个任务的经验迁移至另一个任务。
- 无监督学习:用于训练的样本没有标签,希望机器自己去发现其中的知识,例如聚类算法,将类似的物品聚在一起。
- 监督学习中的结构化学习:对于识别任务来讲,不同的识别任务,需要识别的物品不一样,例如语音,图像,文本。语音之间都存在相似的结构,识别结构也是一个问题。
- 强化学习:把网络想象为一个机器人,机器人会根据当前的任务给出自己的输出,然后根据输出对环境的变化及时调整自己的策略,以达到下次输出更优的目标。(用于无法进行监督学习时)
- 监督学习:有带标签的学习资料(一张图,一段描述图片的话)
-
AI训练师的必要性
- AI训练师要挑选合适的model, function,不同的model,function适合解决不同的问题。
- 模型训练不一定能自己找出最优的function, 这个时候需要有经验的AI炼丹师来做调参等优化。

浙公网安备 33010602011771号