随笔分类 -  Hadoop学习总结

摘要:1、Hadoop介绍Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了一个系统底层细节透明的分布式架构,通过Hadoop,可以将大量的廉价机器的计算资源组织起来,解决单机不能解决的海量数据的处理问题。Hadoop主要有以下几个优点:高可靠性:提供按位处理的存储和计算能力值... 阅读全文
posted @ 2016-05-17 16:55 一杯甜酒 阅读(167) 评论(0) 推荐(0)
摘要:一、大数据的基本概念1.1、什么是大数据 大数据指的就是要处理的数据是TB级别以上的数据。大数据是以TB级别起步的。在计算机当中,存放到硬盘上面的文件都会占用一定的存储空间,例如: 文件占用的存储空间代表的就是该文件的大小,在计算机当中,文件的大小可以采用以下单位来表示,各个单位之间的转换关... 阅读全文
posted @ 2015-12-29 13:34 一杯甜酒 阅读(380) 评论(0) 推荐(0)