大叔算法分享(6)机器学习概览

 

Machine Learning 机器学习 分类

  • Classification (分类)
  • Regression (回归)
  • Clustering (聚类)
  • Dimensionality reduction (降维)

Supervised Learning 监督学习

已有样本数据(TrainingSet)包括输入(Input)和输出(Output),使用样本数据训练(Train)模型函数(Model),最后把未知输入(UnknownInput)带入模型函数,预测(Predict)输出(Output)

监督学习过程如下:

TrainingSet(Input & Output) -> Train -> Model -> Predict(UnknownInput -> Output)

即训练集(包含输入和输出)-> 训练 -> 模型 -> 预测(未知输入-> 输出)

 

一 Classification

分类属于监督学习,分类问题解决的是给定一个样本,预测变量是离散的,比如内容类别预测中,给定一个内容,需要预测出类别:体育、社会、财经等;

二 Regression

回归属于监督学习,回归问题解决的是给定一个样本,预测变量是连续的,比如股价预测中,给定一天的价格等信息,需要预测第二天的价格;

三 Clustering

聚类不属于监督学习,聚类问题解决的是给定一组样本,预测哪些样本之间离的更近,哪些样本之间离的更远,比如用户分群中,根据类别的定义,比如兴趣、购买力等,来将用户划分到多个类别中;

 

posted @ 2019-01-03 22:25  匠人先生  阅读(221)  评论(0编辑  收藏  举报