一.机器学习入门

一:图像领域

包括人脸识别,街道交通信号识别

二:自然语言识别(NPL)

 机器学习定义:

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。

 数据集的构成:特征值+目标值

 机器学习的分类:
1.监督学习(有一个目标的)

       目标值:类别--分类问题(比如说识别猫狗,目标是一个类别)

  目标值:连续型的数据---回归问题(比如说预测房价,目标是一个具体的数)

2.无监督学习


机器学习开发流程

(1) 获取数据
(2) 数据处理
(3) 特征工程
(4) 机器学习算法训练–模型
(5) 模型评估
(6) 应用

 

 

 数据集:数据集主要分为训练集和测试集

 

可用数据集:

  公司内部 百度

  数据接口 花钱

  数据集

       学习阶段可用到的数据集:

    1.sklenrn

               2.kaggle

    3.UCI

Kaggle网址: https://www.kaggle.com/datasets

UCI数据集网址: http://archive.ics.uci.edu/ml/
scikit-learn网址: http://scikit-learn.org/stable/datasets/index.html#datasets

 

posted @ 2023-06-06 21:03  lipu123  阅读(62)  评论(0)    收藏  举报