摘要: 一.大数据就是Hadoop? 一提到大数据,首先想到的就是Hadoop,Hadoop是由Apache基金会开发的分布式系统基础架构,用户可以在不了解分布式底层细节的情况下开发分布式程序。而大数据就是Hadoop么?开源技术Hadoop可以提供相对廉价的分布式的存储系统,通过MadReduce的技术, 阅读全文
posted @ 2019-09-22 19:22 作者桑 阅读(254) 评论(0) 推荐(0)
摘要: 什么是大数据 大数据,官方定义是指那些数据量特别大、数据类别特别复杂的数据集,这种数据集无法用传统的数据库进行存储,管理和处理。 大数据的主要特点为: 数据量大(Volume) 数据类别复杂(Variety) 数据处理速度快(Velocity) 和数据真实性高(Veracity) 合起来被称为4V。 阅读全文
posted @ 2019-09-17 23:05 作者桑 阅读(2063) 评论(0) 推荐(0)