摘要: 1.将hadoop插件放入eclipse/plugins目录中 2.eclipse配置hadoop 依赖包目录 Window—Preferences 3.新建Map/Reduce Project项目 4.显示Map/Reduce Locations 窗口 5.配置Hadoop服务器 6.新建java 阅读全文
posted @ 2016-05-31 12:41 致林 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 本次Hadoop集群安装一共使用四个节点,各节点IP如下: Master 172.22.120.191 Slave1 172.22.120.192 Slave2 172.22.120.193 Slave3 172.22.120.193 系统版本CentOS 6.2L JDK版本:1.7 Hadoop 阅读全文
posted @ 2016-05-31 12:34 致林 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 前段时间在实验室配置了hadoop集群环境,一共4个节点,master + 3 x slave。 选择安装方式,默认为直接安装或者升级系统。 跳过媒体测试 选择语言,这里选择英文 键盘布局 安装方式,默认选项 这里我们会配置四个节点,IP如下 Master 172.22.120.191 Slave1 阅读全文
posted @ 2016-05-31 12:30 致林 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 1. 聚类问题 所谓聚类问题,就是给定一个元素集合D,其中每个元素具有n个可观察属性,使用某种算法将D划分成k个子集,要求每个子集内部的元素之间相异度尽可能低,而不同子集的元素相异度尽可能高。 2. K-均值算法简介 k-means算法,也被称为k-平均或k-均值,是一种得到最广泛使用的聚类算法。 阅读全文
posted @ 2016-05-31 12:27 致林 阅读(1183) 评论(0) 推荐(0) 编辑