dayday+up

2015年7月29日

摘要：维特比算法是一个特殊，但应用最广的动态规划算法。利用动态规划，可以解决任何一个图中的最短路径问题。而维特比算法是针对一个特殊的图--篱笆网络(Lattice)的有向图最短路径问题而提出的。它之所以重要是因为，凡是使用隐含马尔科夫模型描述的问题都可以用它来解码。假如用户输入的拼音是y1,y2,... 阅读全文

posted @ 2015-07-29 17:12 dayday+up 阅读(1750) 评论(0) 推荐(0)

2015年7月28日

mac安装R语言启动后-Warning messages

摘要： During startup - Warning messages:1: Setting LC_CTYPE failed, using "C"2: Setting LC_COLLATE failed, using "C"3: Setting LC_TIME failed, using "C"4: S... 阅读全文

posted @ 2015-07-28 14:23 dayday+up 阅读(1834) 评论(0) 推荐(0)

人工神经网络基础与研究内容

摘要：人工神经网络是对生物神经系统的模拟。它的信息处理功能是由网络单元（神经元）的输入输出特性（激活特性），网络的拓扑结构（神经元的连接方式），连接权大小（突触联系强度）和神经元的阈值（可视为特殊的连接权）等决定。与数字计算机比较，人工神经网络在构成原理和功能特点等方面更加接近人脑，它不是按给定... 阅读全文

posted @ 2015-07-28 11:24 dayday+up 阅读(1003) 评论(0) 推荐(0)

2015年6月30日

Mahout0.9安装与配置（完全分布式模式下运行）

摘要：安装Mahout之前，一定要把hadoop装好，hadoop的安装方法可以参考我的前一篇随笔，我安装的是hadoop2.7.0，具体方法在此不做介绍。1.首先下载相应版本的Mahout:axel -n 10 http://archive.apache.org/dist/mahout/0.9/maho... 阅读全文

posted @ 2015-06-30 17:41 dayday+up 阅读(1238) 评论(2) 推荐(1)

2015年6月26日

hadoop2.7.0分布式系统搭建(ubuntu14.04)

摘要：因为使用需要，在自己小本上建了四个虚拟机，打算搭建一个1+3的hadoop分布式系统。环境：hadoop2.7.0+ubuntu14.04 (64位) 首先分别为搭建好的虚拟机的各主机重命名方法：vi /etc/hostname 例如:ubuntu0 ubuntu1 ubuntu2 ubuntu 阅读全文

posted @ 2015-06-26 10:52 dayday+up 阅读(489) 评论(0) 推荐(0)

2015年5月6日

手写数字0-9的识别代码（SVM支持向量机）

摘要：帮一个贴吧的朋友改的一段代码，源代码来自《机器学习实战》原代码的功能是识别0和9两个数字经过改动之后可以识别0~9，并且将分类器的产生和测试部分分开来写，免得每次测试数据都要重新生成分类器一次。from numpy import *from time import sleepdef loadData... 阅读全文

posted @ 2015-05-06 17:03 dayday+up 阅读(1961) 评论(0) 推荐(0)

2015年4月27日

MapReduce和Hadoop流

摘要： MapReduce:分布式计算的框架MapReduce是一个软件框架，可以将单个计算作业分配给多台计算机执行。 MapReduce在大量节点组成的集群上运行。它的工作流程是：单个作业被分成很多小份，输入数据也被切片分发到每个节点，各个节点只在本地数据上做运算，对应的代码称为mapper，这个过程被... 阅读全文

posted @ 2015-04-27 14:50 dayday+up 阅读(266) 评论(0) 推荐(0)

2015年4月25日

PIL：Python Imaging Library(图像处理标准库)和Qrcode:二维码生成

摘要：安装PILMac或Linux安装命令：sudo easy_install PIL如果报错：fatal error: 'freetype/fterrors.h' file not foundMac下所依赖的FreeType链接变更问题，解决如下：ln -s /usr/local/include/fre... 阅读全文

posted @ 2015-04-25 15:03 dayday+up 阅读(1598) 评论(0) 推荐(0)

2015年4月21日

使用Apriori算法进行关联分析

摘要：关联分析是一种在大规模数据集中寻找有趣关系的任务。这些关系可以有两种形式：频繁项集或者关联规则。频繁项集是指经常出现在一块的物品的集合，关联规则暗示两种物品之间可能存在很强的关系。一个项集的支持度被定义为数据集中包含该项集的记录所占的比例。可信度或置信度是针对一条诸如{尿布}->{葡萄酒}的关联规则... 阅读全文

posted @ 2015-04-21 16:34 dayday+up 阅读(707) 评论(0) 推荐(0)

2015年4月20日

AdaBoost

摘要： AdaBoost是adaptive boosting的缩写，其运行过程如下：1.训练数据中得每个样本，并赋予其一个权重，这些权重构成了向量D。一开始，这些权重都初始化成相等值。2.首先再训练数据上训练出一个弱分类器并计算改分类器的错误率，然后在同一数据集上再次训练弱分类器。3.在分类器的第二次训练中... 阅读全文

posted @ 2015-04-20 17:18 dayday+up 阅读(338) 评论(0) 推荐(0)

公告