随笔分类 - ML
机器学习 python
摘要:PCA主成份分析 一.PCA原理 主成分分析Principal Component Analysis,主要用途:数据的降维。可以理解为提取数据中更有价值的信息 核心的思想:寻找一个新的坐标基,将原有的数据投影到新的坐标基中 1.1基本概念 样本均值 $ x^ =\frac{1}{n}\sum^N_{
阅读全文
摘要:梯度下降算法 一、原理 梯度下降算法是一个用来求解函数最小值的算法,关于算法的详细介绍就不细说了,直接来公式 这里引用吴恩达机器学习的代价函数来说明 代价函数 $$ J(\theta_0,\theta_1) $$ 梯度下降算法 $$ \begin{align} \theta_j &= \theta_
阅读全文
摘要:多元线性回归 一、回归模型 多元线性回归的一般表达式 $$ f(\boldsymbol x_i)=\boldsymbol {w^Tx_i}+b = \begin{bmatrix} {w_{1}}&{w_{2}}&{\cdots}&{w_{d}}\\ \end{bmatrix} \begin{bmat
阅读全文
摘要:单变量线性回归 在这个文档中将会介绍单变量线性回归模型的建立和公式推倒,通过实例的代码实现算法来加深理解 一.模型推导 1 1 线性回归模型 设定样本描述为 $$ x=(x_1;x_2;...;x_d) $$ 预测函数为 $$ f(\boldsymbol x)=w_1x_1+w_2x_2+...+w
阅读全文
摘要:K 近邻算法 一、算法概述 (1)采用测量不同特征值之间的距离方法进行分类 优点: 精度高、对异常值不敏感、无数据输入假定。 缺点: 计算复杂度高、空间复杂度高。 (2)KNN模型的三个要素 kNN算法模型实际上就是对特征空间的的划分。模型有三个基本要素:距离度量、K值的选择和分类决策规则的决定。
阅读全文
摘要:第一章 监督学习 1.1 准备工作 如果你是在windows环境下,建议直接使用anaconda,这里里面集成了一些常用的Python库。 如果是在其他环境下,就更方便了,保证这下面几个已经安装就好了。 NumPy: http://docs.scipy.org/doc/numpy 1.10.1/us
阅读全文

浙公网安备 33010602011771号