Machine_Learning_in_Action01 - ML basics
Machine Learning basics
机器学习基础
机器学习概览
机器学习中的关键问题
为什么需要学习机器学习
为什么Python很重要
机器学习
- 将数据转化为信息
- 使用统计学
- 互联网的出现使得数据海量增长
分类
- 监督学习
- K近邻
- 朴素贝叶斯
- SVM
- 决策树
- 线性回归
- 局部权重的线性回归
- Ridge回归
- Lasso回归
- 无监督学习
- K-Means
- DBSCAN
- Expectation maximization
- Parzen window
机器学习应用的一般开发过程
- 收集数据
- 爬取网页并抽出有用的信息
- 自己收集数据,比如测量风速,血糖水平,或其他信息
- 为节省时间,可以使用公开数据
- 准备输入数据
- 将收集的数据转化为程序可用的数据
- 对相同的特征,不同的算法可能需要不同格式的数据
- 分析数据
- 确保缺失值的数量不会太多
- 尽可能地发现数据的规律或模式
- 对数据可视化,通常特征数会超过3个,可以尝试降维然后可视化
- 人工干预
- 确保没有垃圾数据
- 对于自动化系统,这一步跳过
- 训练算法
- 无监督学习没有训练的步骤,因为你没有设置目标值
- 测试算法
- 应用

浙公网安备 33010602011771号