摘要: 维特比算法是一个特殊,但应用最广的动态规划算法。利用动态规划,可以解决任何一个图中的最短路径问题。而维特比算法是针对一个特殊的图--篱笆网络(Lattice)的有向图最短路径问题而提出的。它之所以重要是因为,凡是使用隐含马尔科夫模型描述的问题都可以用它来解码。 假如用户输入的拼音是y1,y2,... 阅读全文
posted @ 2015-07-29 17:12 dayday+up 阅读(1710) 评论(0) 推荐(0) 编辑
摘要: During startup - Warning messages:1: Setting LC_CTYPE failed, using "C"2: Setting LC_COLLATE failed, using "C"3: Setting LC_TIME failed, using "C"4: S... 阅读全文
posted @ 2015-07-28 14:23 dayday+up 阅读(1613) 评论(0) 推荐(0) 编辑
摘要: 人工神经网络是对生物神经系统的模拟。它的信息处理功能是由网络单元(神经元)的输入输出特性(激活特性),网络的拓扑结构(神经元的连接方式),连接权大小(突触联系强度)和神经元的阈值(可视为特殊的连接权)等决定。 与数字计算机比较,人工神经网络在构成原理和功能特点等方面更加接近人脑,它不是按给定... 阅读全文
posted @ 2015-07-28 11:24 dayday+up 阅读(923) 评论(0) 推荐(0) 编辑
摘要: 安装Mahout之前,一定要把hadoop装好,hadoop的安装方法可以参考我的前一篇随笔,我安装的是hadoop2.7.0,具体方法在此不做介绍。1.首先下载相应版本的Mahout:axel -n 10 http://archive.apache.org/dist/mahout/0.9/maho... 阅读全文
posted @ 2015-06-30 17:41 dayday+up 阅读(1209) 评论(2) 推荐(1) 编辑
摘要: 因为使用需要,在自己小本上建了四个虚拟机,打算搭建一个1+3的hadoop分布式系统。 环境:hadoop2.7.0+ubuntu14.04 (64位) 首先分别为搭建好的虚拟机的各主机重命名 方法:vi /etc/hostname 例如:ubuntu0 ubuntu1 ubuntu2 ubuntu 阅读全文
posted @ 2015-06-26 10:52 dayday+up 阅读(447) 评论(0) 推荐(0) 编辑
摘要: 帮一个贴吧的朋友改的一段代码,源代码来自《机器学习实战》原代码的功能是识别0和9两个数字经过改动之后可以识别0~9,并且将分类器的产生和测试部分分开来写,免得每次测试数据都要重新生成分类器一次。from numpy import *from time import sleepdef loadData... 阅读全文
posted @ 2015-05-06 17:03 dayday+up 阅读(1856) 评论(0) 推荐(0) 编辑
摘要: MapReduce:分布式计算的框架MapReduce是一个软件框架,可以将单个计算作业分配给多台计算机执行。 MapReduce在大量节点组成的集群上运行。它的工作流程是:单个作业被分成很多小份,输入数据也被切片分发到每个节点,各个节点只在本地数据上做运算,对应的代码称为mapper,这个过程被... 阅读全文
posted @ 2015-04-27 14:50 dayday+up 阅读(239) 评论(0) 推荐(0) 编辑
摘要: 安装PILMac或Linux安装命令:sudo easy_install PIL如果报错:fatal error: 'freetype/fterrors.h' file not foundMac下所依赖的FreeType链接变更问题,解决如下:ln -s /usr/local/include/fre... 阅读全文
posted @ 2015-04-25 15:03 dayday+up 阅读(1542) 评论(0) 推荐(0) 编辑
摘要: 关联分析是一种在大规模数据集中寻找有趣关系的任务。这些关系可以有两种形式:频繁项集或者关联规则。频繁项集是指经常出现在一块的物品的集合,关联规则暗示两种物品之间可能存在很强的关系。一个项集的支持度被定义为数据集中包含该项集的记录所占的比例。可信度或置信度是针对一条诸如{尿布}->{葡萄酒}的关联规则... 阅读全文
posted @ 2015-04-21 16:34 dayday+up 阅读(675) 评论(0) 推荐(0) 编辑
摘要: AdaBoost是adaptive boosting的缩写,其运行过程如下:1.训练数据中得每个样本,并赋予其一个权重,这些权重构成了向量D。一开始,这些权重都初始化成相等值。2.首先再训练数据上训练出一个弱分类器并计算改分类器的错误率,然后在同一数据集上再次训练弱分类器。3.在分类器的第二次训练中... 阅读全文
posted @ 2015-04-20 17:18 dayday+up 阅读(305) 评论(0) 推荐(0) 编辑