Machine_Learning_in_Action01 - ML basics

Machine Learning basics
机器学习基础

机器学习概览

机器学习中的关键问题

为什么需要学习机器学习

为什么Python很重要

机器学习

  • 将数据转化为信息
  • 使用统计学
  • 互联网的出现使得数据海量增长

分类

  • 监督学习
    • K近邻
    • 朴素贝叶斯
    • SVM
    • 决策树
    • 线性回归
    • 局部权重的线性回归
    • Ridge回归
    • Lasso回归
  • 无监督学习
    • K-Means
    • DBSCAN
    • Expectation maximization
    • Parzen window

机器学习应用的一般开发过程

  • 收集数据
    • 爬取网页并抽出有用的信息
    • 自己收集数据,比如测量风速,血糖水平,或其他信息
    • 为节省时间,可以使用公开数据
  • 准备输入数据
    • 将收集的数据转化为程序可用的数据
    • 对相同的特征,不同的算法可能需要不同格式的数据
  • 分析数据
    • 确保缺失值的数量不会太多
    • 尽可能地发现数据的规律或模式
    • 对数据可视化,通常特征数会超过3个,可以尝试降维然后可视化
  • 人工干预
    • 确保没有垃圾数据
    • 对于自动化系统,这一步跳过
  • 训练算法
    • 无监督学习没有训练的步骤,因为你没有设置目标值
  • 测试算法
  • 应用
posted @ 2019-07-15 19:28  keep-minding  阅读(72)  评论(0)    收藏  举报