2013年11月10日

前缀树

摘要: 在计算机科学中,trie,又称前缀树,是一种有序树,用于保存关联数组,其中的键通常是字符串。与二叉查找树不同,键不是直接保存在节点中,而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀,也就是这个节点对应的字符串,而根节点对应空字符串。一般情况下,不是所有的节点都有对应的值,只有叶子节... 阅读全文

posted @ 2013-11-10 22:34 代码王子 阅读(260) 评论(0) 推荐(0)

SMO

摘要: 序列最小优化算法(英语:Sequential minimal optimization, SMO)是一种用于解决支持向量机训练过程中所产生优化问题的算法。SMO由微软研究院的约翰·普莱特(John Platt)发明于1998年,目前被广泛使用于SVM的训练过程中,并在通行的SVM库libsvm中... 阅读全文

posted @ 2013-11-10 22:31 代码王子 阅读(441) 评论(0) 推荐(0)

逻辑回归

摘要: 初步接触 谓LR分类器(Logistic Regression Classifier),并没有什么神秘的。在分类的情形下,经过学习之后的LR分类器其实就是一组权值w0,w1,...,wm. 当测试样本集中的测试数据来到时,这一组权值按照与测试数据线性加和的方式,求出一个z值: z = w0+... 阅读全文

posted @ 2013-11-10 22:29 代码王子 阅读(272) 评论(0) 推荐(0)

EM算法

摘要: 1.一般概念介绍 最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。 在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似... 阅读全文

posted @ 2013-11-10 22:28 代码王子 阅读(490) 评论(0) 推荐(0)

决策树

摘要: 一、简介 决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。 数据挖掘中决... 阅读全文

posted @ 2013-11-10 22:27 代码王子 阅读(208) 评论(0) 推荐(0)

KNN算法

摘要: K-最邻近算法总结 1.基本介绍 K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别... 阅读全文

posted @ 2013-11-10 22:26 代码王子 阅读(229) 评论(0) 推荐(0)

贝叶斯方法

摘要: 1. 历史 托马斯·贝叶斯(Thomas Bayes)同学的详细生平在这里。以下摘一段 wikipedia 上的简介: 所谓的贝叶斯方法源于他生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的。在贝 叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“... 阅读全文

posted @ 2013-11-10 22:24 代码王子 阅读(672) 评论(0) 推荐(0)

决策树和决策森林

摘要: 前言: 决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时,单决策树又有一些不好的地方,比如说容易over-fitting,虽然有一些方法,如剪枝可以减少这种情况,但是还是不够的。 模型组... 阅读全文

posted @ 2013-11-10 22:21 代码王子 阅读(1914) 评论(0) 推荐(0)

SVD

摘要: 一、奇异值与特征值基础知识: 特征值分解和奇异值分解在机器学习领域都是属于满地可见的方法。两者有着很紧密的关系,我在接下来会谈到,特征值分解和奇异值分解的目的都是一样,就是提取出一个矩阵最重要的特征。先谈谈特征值分解吧: 1)特征值: 如果说一个向量v是方阵A的特征向量,将... 阅读全文

posted @ 2013-11-10 22:19 代码王子 阅读(213) 评论(0) 推荐(0)

Boosting 和梯度Boosting

摘要: Boosting方法: Boosting这其实思想相当的简单,大概是,对一份数据,建立M个模型(比如分类),一般这种模型比较简单,称为弱分类器(weak learner)每次分类都将上一次分错的数据权重提高一点再进行分类,这样最终得到的分类器在测试数据与训练数据上都可以得到比较好的成绩。... 阅读全文

posted @ 2013-11-10 22:18 代码王子 阅读(368) 评论(0) 推荐(0)

LDA和PCA

摘要: LDA: LDA的全称是Linear Discriminant Analysis(线性判别分析),是一种supervised learning。有些资料上也称为是Fisher’s Linear Discriminant,因为它被Ronald Fisher发明自1936年,Discrimi... 阅读全文

posted @ 2013-11-10 22:16 代码王子 阅读(251) 评论(0) 推荐(0)

SVM算法

摘要: 一、线性分类器: 首先给出一个非常非常简单的分类问题(线性可分),我们要用一条直线,将下图中黑色的点和白色的点分开,很显然,图上的这条直线就是我们要求的直线之一(可以有无数条这样的直线) 假如说,我们令黑色的点 = -1, 白色的点 = +1,直线f(x) = w.x + b... 阅读全文

posted @ 2013-11-10 22:14 代码王子 阅读(242) 评论(0) 推荐(0)

B+树

摘要: B+树 B+ 树是一种树数据结构,通常用于数据库和操作系统的文件系统中。B+ 树的特点是能够保持数据稳定有序,其插入与修改拥有较稳定的对数时间复杂度。B+ 树元素自底向上插入,这与二叉树恰好相反。 B+ 树在节点访问时间远远超过节点内部访问时间的时候,比可作为替代的实现有着实在的优势。这通常在... 阅读全文

posted @ 2013-11-10 21:58 代码王子 阅读(231) 评论(0) 推荐(0)

摘要: 二叉树 二叉查找树(BST) 笛卡尔树 MVP树 Top tree T树 自平衡二叉查找树 AA树 AVL树 左倾红黑树 红黑树 替罪羊树 伸展树 树堆 节点大小平衡树 ... 阅读全文

posted @ 2013-11-10 21:54 代码王子 阅读(101) 评论(0) 推荐(0)

梯度下降法

摘要: 梯度下降法,基于这样的观察:如果实值函数 在点 处可微且有定义,那么函数 在 点沿着梯度相反的方向 下降最快。 因而,如果 对于 为一个够小数值时成立,那么 。 考虑到这一点,我们可以从函数 的局部极小值的初始估计 出发,并考虑如下序列 使得 因此可得到 如果顺利的话... 阅读全文

posted @ 2013-11-10 21:36 代码王子 阅读(172) 评论(0) 推荐(0)

维特比算法

摘要: 维特比算法 维特比算法(Viterbi algorithm)是一种动态规划算法。它用于寻找最有可能产生观测事件序列的-维特比路径-隐含状态序列,特别是在马尔可夫信息源上下文和隐马尔可夫模型中。 术语“维特比路径”和“维特比算法”也被用于寻找观察结果最有可能解释相关的动态规划算法。例如在统计句法... 阅读全文

posted @ 2013-11-10 21:31 代码王子 阅读(686) 评论(0) 推荐(0)

分治法

摘要: 分治法 简介 对于一个规模为n的问题,若该问题可以容易地解决(比如说规模n较小)则直接解决,否则将其分解为k个规模较小的子问题,这些子问题互相独立且与原问题形式相同,递归地解这些子问题,然后将各子问题的解合并得到原问题的解。这种算法设计策略叫做分治法。 分治法的基本思想 任何一个可以用计算机求... 阅读全文

posted @ 2013-11-10 21:22 代码王子 阅读(346) 评论(0) 推荐(0)

动态规划

摘要: 动态规划 本文介绍了动态规划的基本思想和基本步骤,通过实例研究了利用动态规划设计算法的具体途径,讨论了动态规划的一些实现技巧,并将动态规划和其他一些算法作了比较,最后还简单介绍了动态规划的数学理论基础和当前最新的研究成果。 引言——由一个问题引出的算法 考虑以下问题 [例1]最短路径问题 现有... 阅读全文

posted @ 2013-11-10 19:05 代码王子 阅读(486) 评论(0) 推荐(0)

hadoop学习视频

摘要: 杨尚川的视频 http://www.tudou.com/plcover/EvJCo2zl9hQ/ 酷6视频 http://v.ku6.com/show/8PkgqGcarHKndyP3rl_pUw...html?nr=1 优酷hadoop专辑 ... 阅读全文

posted @ 2013-11-10 13:29 代码王子 阅读(82) 评论(0) 推荐(0)

hadoop学习大纲

摘要: 阅读全文

posted @ 2013-11-10 13:08 代码王子 阅读(129) 评论(0) 推荐(0)

导航