随笔分类 -  Big Data

二、Hadoop大数据处理架构
摘要:一、概述 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。是一个能够对大量数据进行分布式处理的软件框架。由Java开发,但开发其应用可以使用多种语言,C,C++,跨平台性非常好。 两大核心:解决了分布式存储和分布式处理两大问题 Hadoop 2.0 (Apache免费开源,企业版可 阅读全文

posted @ 2018-12-25 23:13 TheExile 阅读(355) 评论(0) 推荐(0)

一、大数据的概述
摘要:一、什么是大数据 四个特性(4个V) 数据量大(Volume) 大数据摩尔定律:IDC估测数据一直以50%的速度增长,到2020年,全球将拥有35ZB的数据量。(GB>TB>PB>EB>ZB) 快速化(Velocity) 处理速度快,1秒级决策 多样化(Varity) 数据类型繁多,大部分为非结构化 阅读全文

posted @ 2018-12-24 22:09 TheExile 阅读(462) 评论(0) 推荐(0)

导航