机器学习常见的任务类型
在机器学习中,常见的任务类型包括:
🔹 1. 分类(Classification)
✅ 定义:
将输入数据分到有限个类别中的一种,输出是离散的标签(如“猫”“狗”或“0/1”)。
✅ 示例:
- 判断一封邮件是否是垃圾邮件(是/否)
- 图像识别中识别数字(0-9)
- 医疗诊断(健康/患病)
✅ 模型:
- 逻辑回归(Logistic Regression)
- 决策树、随机森林
- 支持向量机(SVM)
- K近邻(KNN)
- 神经网络
🔹 2. 回归(Regression)
✅ 定义:
预测一个连续值(实数),比如房价、温度等。
✅ 示例:
- 预测房价
- 预测未来股票价格
- 预测气温
✅ 模型:
- 线性回归(Linear Regression)
- 决策树回归
- 支持向量回归(SVR)
- 神经网络回归
🔹 3. 聚类(Clustering)
✅ 定义:
将数据自动分组,分组是无监督的,即没有标签。
✅ 示例:
- 客户群体划分(市场营销)
- 图像分割
- 新闻自动分类
✅ 常见模型:
- K-Means
- DBSCAN
- 层次聚类(Hierarchical Clustering)
🔹 4. 降维(Dimensionality Reduction)
✅ 定义:
把高维数据压缩成低维,尽可能保留信息,常用于可视化或预处理。
✅ 示例:
- 将100维特征压缩为2维用于画图
- 数据预处理前的特征压缩
✅ 方法:
- 主成分分析(PCA)
- t-SNE
- UMAP
- 自编码器(AutoEncoder)
🔹 5. 异常检测(Anomaly Detection)
✅ 定义:
识别与大多数数据行为不同的异常点。
✅ 示例:
- 信用卡欺诈检测
- 服务器入侵检测
- 工厂设备故障预警
✅ 方法:
- One-Class SVM
- 孤立森林(Isolation Forest)
- 统计方法、神经网络
🔹 6. 强化学习(Reinforcement Learning)
✅ 定义:
智能体在环境中试错学习策略,通过奖励/惩罚来优化行为。
✅ 示例:
- AlphaGo 下围棋
- 自动驾驶汽车决策
- 游戏AI
✅ 术语:
- 状态(State)、动作(Action)、奖励(Reward)
- 策略(Policy)、值函数(Value Function)
🔹 7. 排序(Ranking)
✅ 定义:
输出结果是有顺序的列表,而不仅仅是一个标签。
✅ 示例:
- 搜索引擎结果排序
- 推荐系统中排序商品
- 电商首页展示顺序
✅ 方法:
- Learning to Rank(排序学习)
- RankNet、LambdaRank、XGBoost Rank
🔹 8. 生成任务(Generative Tasks)
✅ 定义:
模型学习数据分布,从而生成新的数据。
✅ 示例:
- 图像生成(如生成“假人脸”)
- 文字生成(如 ChatGPT)
- 音乐生成
✅ 模型:
- GAN(生成对抗网络)
- VAE(变分自编码器)
- Transformer(如 GPT)
✅ 总结表格:
| 类型 | 输入 | 输出 | 学习方式 | 
|---|---|---|---|
| 分类 | 特征 | 类别(标签) | 有监督 | 
| 回归 | 特征 | 连续值 | 有监督 | 
| 聚类 | 特征 | 分组 | 无监督 | 
| 降维 | 高维特征 | 低维特征 | 无监督 | 
| 异常检测 | 特征 | 正常/异常 | 无监督/半监督 | 
| 强化学习 | 状态/环境 | 动作策略 | 强化 | 
| 排序 | 特征/内容 | 有序列表 | 有监督/半监督 | 
| 生成 | 噪声/条件 | 图像/文字等 | 无监督/自监督 | 
 
                     
                    
                 
                    
                
 
                
            
         
         浙公网安备 33010602011771号
浙公网安备 33010602011771号