智能学习基本原理
1. 机器学习
机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。
机器学习(监督学习)的方法论本质,即在“机器思考”的过程中确定模型的三个关键要素:假设、评价、优化。其学习的本质是“参数估计”。学习目标都是拟合一个“大公式 f()”
机器学习的实现可以分成两步:训练和预测。从一定数量的样本(已知模型输入x和模型输出y)中,学习输出y与输入x的关系(某种表达式);再基于训练得到的y与x之间的关系,如出现新的输入x,计算出输出y。通常情况下,如果通过模型计算的输出和真实场景的输出一致,则说明模型是有效的。
衡量模型预测值和真实值差距的评价函数也被称为损失函数(Loss)。
2. 深度学习
相比于相比传统的机器学习算法,深度学习的假设的更为复杂,无法简单使用数学公式表达,因此研究者们借鉴了人脑神经元的结构,设计出神经网络的模型。
神经网络
人工神经网络包括多个神经网络层,如:卷积层、全连接层、LSTM等,每一层又包括很多神经元,超过三层的非线性神经网络都可以被称为深度神经网络。通俗的讲,深度学习的模型可以视为是输入到输出的映射函数,如图像到高级语义(美女)的映射,足够深的神经网络理论上可以拟合任何复杂的函数。
神经网络中每个节点称为神经元,由两部分组成:1. 加权和:将所有输入加权求和。2. 非线性变换(激活函数):加权和的结果经过一个非线性函数变换,让神经元计算具备非线性的能力。
大量这样的节点按照不同的层次排布,形成多层的结构连接起来,即称为神经网络。
神经网络并没有那么神秘,它的本质是一个含有很多参数的“大公式”。
深度学习改变了很多领域算法的实现模式。在深度学习兴起之前,很多领域建模的思路是投入大量精力做特征工程,将专家对某个领域的“人工理解”沉淀成特征表达,然后使用简单模型完成任务(如分类或回归)。而在数据充足的情况下,深度学习模型可以实现端到端的学习,即不需要专门做特征工程,将原始的特征输入模型中,模型可同时完成特征提取和分类任务。
深度学习还推动人工智能进入工业大生产阶段,算法的通用性导致标准化、自动化和模块化的框架产生。

浙公网安备 33010602011771号