机器学习常见的任务类型

在机器学习中,常见的任务类型包括:


🔹 1. 分类(Classification)

✅ 定义:

将输入数据分到有限个类别中的一种,输出是离散的标签(如“猫”“狗”或“0/1”)。

✅ 示例:

  • 判断一封邮件是否是垃圾邮件(是/否)
  • 图像识别中识别数字(0-9)
  • 医疗诊断(健康/患病)

✅ 模型:

  • 逻辑回归(Logistic Regression)
  • 决策树、随机森林
  • 支持向量机(SVM)
  • K近邻(KNN)
  • 神经网络

🔹 2. 回归(Regression)

✅ 定义:

预测一个连续值(实数),比如房价、温度等。

✅ 示例:

  • 预测房价
  • 预测未来股票价格
  • 预测气温

✅ 模型:

  • 线性回归(Linear Regression)
  • 决策树回归
  • 支持向量回归(SVR)
  • 神经网络回归

🔹 3. 聚类(Clustering)

✅ 定义:

将数据自动分组,分组是无监督的,即没有标签。

✅ 示例:

  • 客户群体划分(市场营销)
  • 图像分割
  • 新闻自动分类

✅ 常见模型:

  • K-Means
  • DBSCAN
  • 层次聚类(Hierarchical Clustering)

🔹 4. 降维(Dimensionality Reduction)

✅ 定义:

把高维数据压缩成低维,尽可能保留信息,常用于可视化或预处理。

✅ 示例:

  • 将100维特征压缩为2维用于画图
  • 数据预处理前的特征压缩

✅ 方法:

  • 主成分分析(PCA)
  • t-SNE
  • UMAP
  • 自编码器(AutoEncoder)

🔹 5. 异常检测(Anomaly Detection)

✅ 定义:

识别与大多数数据行为不同的异常点

✅ 示例:

  • 信用卡欺诈检测
  • 服务器入侵检测
  • 工厂设备故障预警

✅ 方法:

  • One-Class SVM
  • 孤立森林(Isolation Forest)
  • 统计方法、神经网络

🔹 6. 强化学习(Reinforcement Learning)

✅ 定义:

智能体在环境中试错学习策略,通过奖励/惩罚来优化行为。

✅ 示例:

  • AlphaGo 下围棋
  • 自动驾驶汽车决策
  • 游戏AI

✅ 术语:

  • 状态(State)、动作(Action)、奖励(Reward)
  • 策略(Policy)、值函数(Value Function)

🔹 7. 排序(Ranking)

✅ 定义:

输出结果是有顺序的列表,而不仅仅是一个标签。

✅ 示例:

  • 搜索引擎结果排序
  • 推荐系统中排序商品
  • 电商首页展示顺序

✅ 方法:

  • Learning to Rank(排序学习)
  • RankNet、LambdaRank、XGBoost Rank

🔹 8. 生成任务(Generative Tasks)

✅ 定义:

模型学习数据分布,从而生成新的数据

✅ 示例:

  • 图像生成(如生成“假人脸”)
  • 文字生成(如 ChatGPT)
  • 音乐生成

✅ 模型:

  • GAN(生成对抗网络)
  • VAE(变分自编码器)
  • Transformer(如 GPT)

✅ 总结表格:

类型 输入 输出 学习方式
分类 特征 类别(标签) 有监督
回归 特征 连续值 有监督
聚类 特征 分组 无监督
降维 高维特征 低维特征 无监督
异常检测 特征 正常/异常 无监督/半监督
强化学习 状态/环境 动作策略 强化
排序 特征/内容 有序列表 有监督/半监督
生成 噪声/条件 图像/文字等 无监督/自监督

posted @ 2025-07-28 09:15  daviyoung  阅读(122)  评论(0)    收藏  举报