2016 年 1月 20 日随笔档案 - 松伯

2016年1月20日

摘要：大数据体系结构:Spark简介Spark是整个BDAS的核心组件，是一个大数据分布式编程框架，不仅实现了MapReduce的算子map 函数和reduce函数及计算模型，还提供更为丰富的算子，如filter、join、groupByKey等。是一个用来实现快速而同用的集群计算的平台。Spark将分布... 阅读全文

posted @ 2016-01-20 21:04 松伯阅读(1099) 评论(0) 推荐(0)

HBASE解析

摘要： Hbase是运行在Hadoop上的NoSQL数据库，它是一个分布式的和可扩展的大数据仓库，也就是说HBase能够利用HDFS的分布式处理模式，并从Hadoop的MapReduce程序模型中获益。这意味着在一组商业硬件上存储许多具有数十亿行和上百万列的大表。除去Hadoop的优势，HBase本身就是十... 阅读全文

posted @ 2016-01-20 20:44 松伯阅读(308) 评论(0) 推荐(0)