12 2015 档案

摘要:环境搭建版本: Ubuntu 14.04.1 LTS 64位桌面版 hadoop-2.2.0.tar.gz jdk-7u67-linux-x64.tar.gz scala-2.10.4.tgz spark-1.1.0-bin-hadoop2.4.tgz Scala配置: Scala-2.10.4解压 阅读全文
posted @ 2015-12-30 10:11 xmeo 阅读(371) 评论(0) 推荐(0)
摘要:一.MapReduce MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。分别有: "Map(映射)"和"Reduce(归约)" Map的作用是过滤一些原始数据,Reduce则是处理这些数据,得到我们想要的结果, 二.mapreduce实现图的BFS图示 要遍历的图: 输入 阅读全文
posted @ 2015-12-05 10:36 xmeo 阅读(1232) 评论(0) 推荐(0)