Hadoop简介
简介
大数据
关键两大技术:分布式存储,分布式处理
批处理计算:MapReduce,Spark
流计算:S4,Strom,Flume
图计算:Google Pergel
查询分析计算:Hive,Caddandes
云计算
分布式存储;分布式处理
虚拟化,多用户
通过网络以服务的方式为用户提供廉价的IT资源
saas:基础设施既服务
paas:平台既服务
saas:云财务软件
物联网
应用层
处理层
网络层
感知层
关键技术:识别技术,感知技术
Hadoop
简介:
两大核心:HDFS+MapReduce
Hadoop1.0,Hadoop2.0
Linux:基础
shell,sudo
Hadoop集群的部署与使用
先访问nameNode 存储DataNode
JobTracker TaskTracker