摘要: 目录 1.如何构建numpy数组2.如何观察数组属性的大小和形状3. 如何从数组提取特定的项3.1 如何反转数组3.3 如何计算n维数组的平均值,最小值和最大值4. 如何从现有的数组定义新数组5. 多维数组的重构(reshaping)和扁平(flattening)5.1 flatten()和rave 阅读全文
posted @ 2019-05-11 09:49 机器学习算法那些事 阅读(912) 评论(0) 推荐(0) 编辑
摘要: 前言 支持向量机是最重要的机器学习算法之一,支持向量机的一个重要特点是通过核函数进行非线性分类。本文深度剖析了核函数的含义,并从该角度去理解线性回归和非线性分类的问题。 目录 1、线性回归的核函数表示 2、核函数含义解析 3、核函数含义理解线性回归 4、核函数含义理解非线性分类 5、核函数的应用范围 阅读全文
posted @ 2018-11-13 08:08 机器学习算法那些事 阅读(2268) 评论(0) 推荐(0) 编辑
摘要: 当我们应用统计方法对数据进行分析时,会发现许多分析方法如T检验、方差分析、相关分析以及线性回归等等,都要求数据服从正态分布或近似正态分布,正态分布在机器学习的重要性后期会讲述。上一篇文章用Q-Q图来验证数据集是否符合正态分布,本文首先介绍了偏度与峰度的定义,然后用偏度与峰度检测数据集是否符合正态分布 阅读全文
posted @ 2018-11-08 22:49 机器学习算法那些事 阅读(18181) 评论(0) 推荐(0) 编辑
摘要: 样本数据集在构建机器学习模型的过程中具有重要的作用,样本数据集包括训练集、验证集、测试集,其中训练集和验证集的作用是对学习模型进行参数择优,测试集是测试该模型的泛化能力。 正负样本数据集符合独立同分布是构建机器学习模型的前提,从概率角度分析,样本数据独立同分布是正负样本数据是从某一特定的数据分布随机 阅读全文
posted @ 2018-11-08 19:25 机器学习算法那些事 阅读(1396) 评论(0) 推荐(0) 编辑
摘要: 一、机器学习简述 机器学习是通过学习现有的训练数据,获得”知识“,然后把该”知识“应用到新的数据中。机器学习学习现有的训练数据主要分为四个步骤:(一)计算训练数据的特征,(二)选择学习模型,如逻辑斯蒂回归,支持向量机或决策树等模型;(三)确定代价函数,代价函数最小化对应的模型为最佳模型,相同的训练数 阅读全文
posted @ 2018-11-08 18:56 机器学习算法那些事 阅读(494) 评论(0) 推荐(1) 编辑