摘要: 一、在Ubuntu下创建hadoop组和hadoop用户增加hadoop用户组,同时在该组里增加hadoop用户,后续在涉及到hadoop操作时,我们使用该用户。1、创建hadoop用户组2、创建hadoop用户sudo adduser -ingroup hadoop hadoop回车后会提示输入新... 阅读全文
posted @ 2014-11-20 22:30 左晓 阅读(185) 评论(0) 推荐(0)
摘要: 一、安装Eclipse下载Eclipse,解压安装,例如安装到/usr/local,即/usr/local/eclipse4.3.1版本下载地址:http://pan.baidu.com/s/1eQkpRgu二、在eclipse上安装hadoop插件1、下载hadoop插件下载地址:http://p... 阅读全文
posted @ 2014-11-20 22:29 左晓 阅读(214) 评论(0) 推荐(0)
摘要: 全文引用于http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/1939687.html一、奇异值与特征值基础知识: 特征值分解和奇异值分解在机器学习领域都是属于满地可见的方法。两者有着很紧密的关系,我在接下来会谈到,特征值分解和奇异值分解的目的... 阅读全文
posted @ 2014-07-17 20:25 左晓 阅读(613) 评论(0) 推荐(0)
摘要: 1.简介数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西。 诚然,如果做算法实现甚至算法优化,确实需要很多背景知识。但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西。他们的精力,集中在特征提取, 算法选择和参数调优上。那么,一个可以方便地提供这些功能的工具,便是十分必要的了。而w... 阅读全文
posted @ 2014-07-13 22:04 左晓 阅读(2657) 评论(0) 推荐(1)
摘要: 一:环境准备:基于Windows下的VMware Player4.0.3中的ubuntu12.04-64server.下载免费的VMware Player并安装好;下载 免费的Ubuntu 12.04 server版并在VMware中安装好;二:基础安装:执行如下命令升级部分软件和把ssh安装好:(... 阅读全文
posted @ 2014-05-25 11:22 左晓 阅读(199) 评论(0) 推荐(0)
摘要: 上一篇介绍了VisualSVN Server和TortoiseSVN的下载,安装,汉化.这篇介绍一下如何使用VisualSVN Server建立版本库,以及TortoiseSVN的使用.首先打开VisualSVN Server Manager,如图:可以在窗口的右边看到版本库的一些信息,比如状态,日... 阅读全文
posted @ 2014-05-15 09:38 左晓 阅读(346) 评论(0) 推荐(0)
摘要: 转自:http://www.cnblogs.com/xiaobaihome/archive/2012/03/20/2407610.htmlSubversion是优秀的版本控制工具,其具体的的优点和详细介绍,这里就不再多说.首先来下载和搭建SVN服务器.现在Subversion已经迁移到apache网... 阅读全文
posted @ 2014-05-15 09:27 左晓 阅读(780) 评论(0) 推荐(0)
摘要: Json_lib可以方便的将Java对象转成json格式的字符串,也可以将Java对象转换成xml格式的文档,同样可以将Json字符串转换成Java对象,或者将xml字符串转换成Java对象。官网:http://json-lib.sourceforge.net/JSON在线转换:http://json.parser.online.fr/JSON教程:http://www.json.org/json-zh.html官网上说明了json_lib还需要依赖的Jar包有:JAR网址jakarta commons-lang 2.5http://commons.apache.org/lang/downlo 阅读全文
posted @ 2014-04-09 16:54 左晓 阅读(334) 评论(0) 推荐(0)
摘要: 1.安装setuptools登录http://pypi.python.org/pypi/setuptools#files下载setuptools-0.6c11.win32-py2.6.exe(md5) 打开setup.py执行即可。 2.其实在安装pydelicious之前要安装feedparser软件包,本来以为很简单,就下载了feedparser和pydelicious软件包,分别运行两个文件里面的setup.py,都出现了以下的错误: >>>Traceback (most recent call last): File "C:\Documents and Se 阅读全文
posted @ 2014-04-06 11:53 左晓 阅读(2179) 评论(0) 推荐(0)
摘要: 1、协作型过滤(collaborative filtering)一个协作型过滤算法通常的做法是对一大群人进行搜索,并从中找出与我们品味相近的一小群人。算法会对这些人所偏爱的其他内容进行考查,并将它们组合起来构造出一个经过排序的推荐列表。2、搜索偏好第一件事情,寻找一种表达不同人及其偏好的方法,使用嵌套字典。# A dictionary of movie critics and their ratings of a small# set of movies#一个涉及影评者以及对几部影片评分情况的字典critics={'Lisa Rose': {'Lady in the W 阅读全文
posted @ 2014-04-03 16:35 左晓 阅读(227) 评论(0) 推荐(0)