随笔分类 -  机器学习实战

1

最大似然估计、最大后验概率估计、贝叶斯公式的理解
摘要:概率和统计是同一个东西吗? 概率:已知模型和参数,求数据 统计:已知数据,求模型和参数 贝叶斯公式在说什么? 公式里括号后面一项才是 条件概率: 贝叶斯公式: 贝叶斯公式: 理解:有多重情况可能导致事件B发生,现在事件B已经发生了,要求出由于事件A导致事件B发生的可能性大小。 似然函数 概率:在参数 阅读全文

posted @ 2018-06-29 20:30 Aaron12 阅读(391) 评论(0) 推荐(0)

正则化
摘要:一、正则化基础 正则化等价于结构风险最小化,就是在经验风险后面加上了表示模型复杂度的正则化项或惩罚项。 正则化的作用是 选择经验风险和模型复杂度都较小的模型,减低模型复杂度,防止过拟合,提高泛化能力。 一般来说,高复杂度的模型容易过拟合,因为它需要学习更多的特征参数,而往往训练样本的数量不足以让其充 阅读全文

posted @ 2018-06-19 19:39 Aaron12 阅读(464) 评论(0) 推荐(0)

KKT条件 拉格朗日乘子法
摘要: 阅读全文

posted @ 2018-06-03 20:20 Aaron12 阅读(111) 评论(0) 推荐(0)

损失函数 风险函数 目标函数
摘要: 阅读全文

posted @ 2018-06-03 20:10 Aaron12 阅读(221) 评论(0) 推荐(0)

机器学习实战-SVD
摘要:14.1 SVD的应用 特点: 利用SVD能够用小得多的数据集来表示原始数据集。 优点:简化数据,去除噪声,提高算法的结果。 缺点:数据的转换可能难以理解。 隐性语义索引(LSI) 利用SVD的方法为隐性语义索引(Latent Semantic Indexing, LSI)或隐性语义分析(Laten 阅读全文

posted @ 2018-05-23 21:34 Aaron12 阅读(442) 评论(0) 推荐(0)

PCA
摘要:注意协方差的理解:协方差是用来衡量数据相互联系程度的量,协方差矩阵是用来衡量多维数据中每一维的相互联系 通过协方差计算数据中的主要成分 从而主成分分析。 机器学习实战 PCA程序 阅读全文

posted @ 2018-05-22 20:31 Aaron12 阅读(247) 评论(0) 推荐(0)

聚类
摘要:。。。 阅读全文

posted @ 2018-05-21 16:56 Aaron12 阅读(80) 评论(0) 推荐(0)

树回归
摘要:。。。 一共五个程序 阅读全文

posted @ 2018-05-20 21:17 Aaron12 阅读(115) 评论(0) 推荐(0)

预测数值型数据:回归
摘要:。。。 阅读全文

posted @ 2018-05-19 21:32 Aaron12 阅读(110) 评论(0) 推荐(0)

提升分类性能-AdaBoost
摘要:一 前言 前面的文章已经介绍了五种不同的分类器,它们各有优缺点。我们可以很自然地将不同的分类器组合起来,而这种组合结果则被成为集成方法(ensemble method)或者元算法(meta-algorithm)。使用集成方法时会有多种形式:可以是不同算法的集成,也可以是同一种算法在不同设置下的集成, 阅读全文

posted @ 2018-05-15 20:12 Aaron12 阅读(284) 评论(0) 推荐(0)

SVM基础知识
摘要:别人的资料 解密SVM系列(一):关于拉格朗日乘子法和KKT条件 解密SVM系列(二):SVM的理论基础 解密SVM系列(三):SMO算法原理与实战求解 解密SVM系列(四):SVM非线性分类原理实验 深入理解拉格朗日乘子法(Lagrange Multiplier)和KKT条件 支持向量机通俗导论( 阅读全文

posted @ 2018-05-05 11:12 Aaron12 阅读(272) 评论(0) 推荐(0)

基于SVM的数字识别
摘要:KNN也能实现数字识别但需要保留所有的训练样本,支持向量机只需要保留支持向量就可以达到类似的效果 支持向量机本质上是一个二分类器 代码如下: 结果如下: 除此外要有公式推导 阅读全文

posted @ 2018-05-05 10:59 Aaron12 阅读(2791) 评论(0) 推荐(0)

使用贝叶斯分类器从个人广告中获取区域倾向
摘要:贝叶斯是一种简单有效的分类模型,尤其适用于自然语言处理,关于贝叶斯的应用,这个例子也要好好看 阅读全文

posted @ 2018-05-03 20:58 Aaron12 阅读(265) 评论(0) 推荐(0)

logistic回归预测病马死亡率
摘要:Logistic 回归 概述 Logistic 回归虽然名字叫回归,但是它是用来做分类的。其主要思想是: 根据现有数据对分类边界线建立回归公式,以此进行分类。 基础概念 Sigmoid 函数 回归 概念 假设现在有一些数据点,我们用一条直线对这些点进行拟合(这条直线称为最佳拟合直线),这个拟合的过程 阅读全文

posted @ 2018-05-03 20:11 Aaron12 阅读(913) 评论(0) 推荐(0)

贝叶斯垃圾邮件过滤
摘要:朴素贝叶斯 概述 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本章首先介绍贝叶斯定理。最后,我们通过实例来讨论贝叶斯分类的中最简单的一种: 朴素贝叶斯分类。 称之为朴素是因为整个形式化过程只做最原始最简单的假设。 贝叶斯理论 & 条件概率 贝叶斯理论 我们现在有 阅读全文

posted @ 2018-05-03 15:31 Aaron12 阅读(459) 评论(0) 推荐(0)

使用决策树预测隐形眼镜类型
摘要:1、算法思想:从根节点开始,对实例的某一特征进行测试,根据测试结果将实例分配到其子节点;每一个子节点对应着该特征的一个取值。如此递归地对实例进行测试并分配,直至达到叶节点。最后将实例分配到叶节点的类中。 k近邻算法可以完成多分类任务,缺点是无法给出数据的内在含义,决策树的主要优势在于数据形式容易理解 阅读全文

posted @ 2018-04-19 15:24 Aaron12 阅读(1036) 评论(0) 推荐(0)

KNN手写数字识别
摘要:kNN算法思想:从训练集中找到和新数据最接近的k条记录,然后根据他们中出现最多的分类来决定新数据的类别 1、KNN伪代码: 2、距离度量方式: --欧氏距离 --曼哈顿距离 --切比雪夫距离 --余弦相似度(适合文本分析)衡量样本向量之间的差异 3、优缺点: --优点:简单有效易于实现 --缺点:必 阅读全文

posted @ 2018-04-18 09:33 Aaron12 阅读(268) 评论(0) 推荐(0)

支持向量机
摘要:0.相关概念 分类器:给定一个样本的数据,判定这个样本属于哪个类别的算法。 特征:输入到分类器中的数据叫做特征。以股票涨跌预测问题为例,特征就是前一天的交易量和收盘价。 线性分类器:线性分类器是分类器中的一种,就是判定分类结果的根据是通过特征的线性组合得到的,不能通过特征的非线性运算结果作为判定根据 阅读全文

posted @ 2017-10-31 15:40 Aaron12 阅读(296) 评论(0) 推荐(0)

入门基础知识
摘要:数据分析入门 大数据的流程:数据收集、数据储存、数据建模、数据分析、数据变现。 大量看似不相关的事却能够通过观察分析告诉人们背后的因果,并预测未来趋势。 数据:承载了信息的东西才是数据 信息:把我们不清楚的事情阐明的描述 排列组合与古典概型 古典概型:包含的单位事件是有限的,且单位事件包含的概率相等 阅读全文

posted @ 2017-09-30 10:39 Aaron12 阅读(315) 评论(0) 推荐(0)

轻松看懂机器学习十大常用算法
摘要:通过本篇文章可以对机器学习的常用算法有个大概的的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。 今天的算法如下: 1. 决策树 根据一些特征对数据分类,每个节点提一个问题,通 阅读全文

posted @ 2017-09-28 16:59 Aaron12 阅读(425) 评论(0) 推荐(0)

1

导航