随笔分类 -  Hadoop

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
摘要: 阅读全文
posted @ 2018-05-30 13:41 帅_詹姆斯邦德 阅读(145) 评论(0) 推荐(0)
摘要:MapReduce的主要应用场景 可以转化为MR任务的条件: 问题必须可以拆分 子问题必须独立 数据结构能够满足key-value的这样的模式 常见场景: 计数与求和,如:日志查询、统计分析 整理归类,如:构建倒排索引,ETL(Extract-Transform-Load 用来描述将数据从来源端经过 阅读全文
posted @ 2018-05-30 11:43 帅_詹姆斯邦德 阅读(329) 评论(0) 推荐(0)
摘要:Hadoop部分大纲 (一)、Hadoop的起源和背景知识 1、什么是大数据?两个例子、大数据的核心问题是什么? 举例:(1)商品推荐——问题1:大量的订单如何存储?问题2:大量的订单如何计算? (2)天气预报——问题1:大量的天气数据如何存储?问题2:大量的的天气数据如何计算? 大数据的核心问题: 阅读全文
posted @ 2018-05-29 21:16 帅_詹姆斯邦德 阅读(307) 评论(0) 推荐(0)