机器学习基础

本文对应《机器学习实战》第一章的笔记

今天看见字如面里面王小波写给李银河的信里有这么的话:
有很多的人,在从少年踏入成人的时候差了一步,于是生活中美好的一面就和他们永别了,真是可惜;在所有的好书中写得明明白白的东西,在人步入卑贱的时候就永远看不懂,永远误解了,真是可惜;在人世间,有一种庸俗势力的大合唱,谁一旦对他屈服,就永远沉沦了,真是可惜;有无数为人师表的先生们,在按照他们自己的模样塑造别人,真是可惜;有很多很多中国人活在世上什么也不干,只是在周围逡巡,发现了什么就一拥而上。
---这一切与我格格不入 王小波

数据类型

标称型和数值型

非均衡分类问题

一旦训练样本某个分类的数据多于其他分类的数据,就会出现非均衡分类问题。

有监督学习

分类和回归

无监督学习:

聚类 数据集合分成由类似的对象组成的多个类的过程
密度估计 寻找描述数据统计值的过程

开发机器学习应用程序步骤:

①收集数据
②准备输入数据
③分析输入数据
④训练算法
⑤测试算法
⑥使用算法

python现有库

Numpy、Scipy 向量矩阵操作
Matploitlib 绘制2D、3D图形
Pylab 集成Numpy、Scipy、Matploitlib

>>> from numpy import *
>>> random.rand(4,4)        # 构造一个4*4的随机数组
# NumPy有两种数据类型 矩阵matrix和数组array
>>> randMat = mat(random.rand(4,4))     # mat()将数组转化为矩阵
>>> randMat.I       # 矩阵求逆
>>> eye(n)           # n阶单位矩阵
posted @ 2017-10-10 23:07  随意orz  阅读(119)  评论(0编辑  收藏  举报