监督学习是一种机器学习方法,核心是用带有 “标准答案” 的数据集训练模型。每个输入样本都对应已知的输出标签,模型通过学习这些数据,找到输入与输出之间的映射关系,最终实现对新数据的预测。
给机器大量x对应y的数据集,大量数据集训练后给予一个新的x,机器尝试生成适当的y。算法通过分析这些训练样本,学习到一个从输入到输出的映射关系,然后利用这个映射关系对新的、未见过的样本进行预测。
- 回归(Regression):预测连续型输出。
例:根据房屋面积、房龄预测房价,根据温度、湿度预测农作物产量。 线性回归,拟合直线,曲线或其他函数?
- 分类(Classification):预测离散型输出(类别)。
例:判断邮件是否为垃圾邮件(是 / 否),根据医学影像判断肿瘤性质(良性 / 恶性)。0或1,两种可能的输出?可多个输入进行优化,分类划分。
- 准备带标签的训练数据集(输入 x + 输出 y)
- 选择合适的模型(如线性回归、逻辑回归)
- 训练模型,优化参数以最小化预测误差
- 用测试集评估模型性能,迭代优化