机器学习的主要范式
机器学习的主要范式
机器学习是人工智能的核心分支,其核心目标是让计算机系统能够从数据中自动学习规律,并用于预测、决策或控制。根据训练数据的形式、可用信息以及学习目标的不同,机器学习方法通常被划分为若干“学习范式”。理解这些范式,有助于我们选择合适的方法解决实际问题。
以下是当前主流的机器学习范式及其特点:
1. 监督学习(Supervised Learning)
定义:在监督学习中,模型通过一组带有标签的训练样本进行学习。每个样本包含输入特征(如图像像素、文本词向量)和对应的正确输出(标签,如“猫”或“狗”)。
目标:学习一个从输入到输出的映射函数,使得对新样本也能做出准确预测。
典型任务:
- 分类:预测离散类别(例如:判断邮件是否为垃圾邮件)。
- 回归:预测连续数值(例如:预测房价或气温)。
常见算法:线性回归、逻辑回归、支持向量机(SVM)、决策树、随机森林、梯度提升树(如XGBoost)、深度神经网络等。
应用场景:图像识别、语音转文字、信用评分、销量预测等。
2. 无监督学习(Unsupervised Learning)
定义:训练数据没有标签,模型需自行发现数据中的内在结构或模式。
目标:揭示数据的分布特性、分组关系或简化表示。
典型任务:
- 聚类:将相似样本归为一类(如客户分群)。
- 降维:减少特征维度,保留关键信息(如用PCA可视化高维数据)。
- 异常检测:识别与大多数数据显著不同的点。
- 密度估计:建模数据的概率分布。
常见算法:K均值聚类、层次聚类、主成分分析(PCA)、自编码器(Autoencoder)、高斯混合模型(GMM)等。
应用场景:市场细分、社交网络分析、数据压缩、预处理等。
3. 半监督学习(Semi-supervised Learning)
定义:训练数据中仅有少量样本有标签,大量样本无标签。该范式结合了监督与无监督学习的优点。
目标:利用丰富的无标签数据提升模型泛化能力,尤其适用于标注成本高昂的场景。
核心思想:假设数据分布具有某种结构(如“同类样本聚集在一起”),无标签数据可帮助模型更好地拟合决策边界。
应用场景:医学影像分析(医生标注耗时)、自然语言处理(大规模文本难以全标注)等。
4. 强化学习(Reinforcement Learning, RL)
定义:智能体(Agent)通过与环境持续交互,根据所获奖励信号调整自身行为策略。
目标:学习一个策略(Policy),使得长期累积奖励最大化。
关键要素:
- 状态(State):环境的当前情况。
- 动作(Action):智能体可执行的操作。
- 奖励(Reward):环境对动作的即时反馈。
- 策略(Policy):从状态到动作的映射。
典型算法:Q-learning、Deep Q-Network(DQN)、策略梯度(Policy Gradient)、Actor-Critic 方法等。
应用场景:游戏AI(如AlphaGo)、机器人控制、自动驾驶、资源调度等。
5. 自监督学习(Self-supervised Learning)
定义:一种特殊的无监督学习,通过从数据本身构造监督信号(称为“预训练任务”)来学习通用表示。
目标:在无标签数据上预训练模型,使其学到对下游任务有用的知识。
典型方法:
- 在NLP中:BERT通过“掩码语言建模”(预测被遮盖的词)进行预训练。
- 在CV中:SimCLR通过对比学习,让同一图像的不同增强版本在特征空间中靠近。
优势:大幅减少对人工标注的依赖,已成为大模型训练的基础范式。
6. 迁移学习(Transfer Learning)
定义:将在一个任务(源任务)上学到的知识,迁移到另一个相关但不同的任务(目标任务)中。
常见做法:使用在大规模数据集(如ImageNet)上预训练的模型,仅对最后几层进行微调(Fine-tuning)以适应新任务。
优势:节省训练时间、降低数据需求、提升小数据场景下的性能。
应用场景:医疗影像诊断(用自然图像预训练模型)、小语种机器翻译等。
7. 多任务学习(Multi-task Learning)
定义:同时学习多个相关任务,共享部分模型参数,使各任务相互促进。
优势:提升模型泛化能力,防止过拟合,尤其适用于数据稀疏的任务。
示例:在语音识别中,同时预测音素和词边界;在推荐系统中,同时预测点击率和停留时长。
8. 元学习(Meta-learning / “学会学习”)
定义:训练模型使其具备快速适应新任务的能力,通常基于少量样本(即“小样本学习”)。
核心思想:不是学习某个具体任务,而是学习“如何学习”。
代表算法:MAML(Model-Agnostic Meta-Learning)、Reptile。
应用场景:个性化推荐、机器人快速适应新环境、少样本图像分类等。
总结
| 范式 | 是否需要标签 | 核心目标 | 典型应用 |
|---|---|---|---|
| 监督学习 | 是 | 预测已知输出 | 图像分类、房价预测 |
| 无监督学习 | 否 | 发现数据结构 | 客户聚类、降维 |
| 半监督学习 | 少量 | 利用无标签数据提升性能 | 医学图像分析 |
| 强化学习 | 奖励信号 | 最大化长期回报 | 游戏AI、机器人 |
| 自监督学习 | 否(自动生成标签) | 学习通用表示 | BERT、视觉预训练 |
| 迁移学习 | 目标任务可能有少量 | 知识迁移 | 小数据场景建模 |
| 多任务学习 | 多个任务的标签 | 联合优化 | 多目标预测 |
| 元学习 | 多个任务的少量样本 | 快速适应新任务 | 小样本学习 |
在实际工程中,这些范式常常组合使用。例如:先用自监督学习在海量无标签数据上预训练模型,再用少量标注数据进行监督微调;或在强化学习中引入模仿学习(监督信号)加速训练。
理解不同范式的适用条件和内在逻辑,是构建高效、鲁棒机器学习系统的关键一步。

浙公网安备 33010602011771号